Saúde
PUBLICIDADE

Por O GLOBO

Uma equipe de pesquisadores médicos da Escola de Medicina e Odontologia Schulich da Western University descobriu que o ChatGPT ainda não está pronto para ser usado em ambientes de diagnóstico para doenças humanas. Pesquisas anteriores e evidências anedóticas mostraram que modelos de linguagem grande (LLM) como o ChatGPT podem fornecer resultados impressionantes em algumas solicitações, como escrever um poema de amor para a namorada, mas também podem retornar respostas incorretas ou bizarras.

Por isso, especialistas sugerem cautela ao usar os resultados produzidos por um desses modelos para tópicos importantes como conselhos de saúde. No novo estudo, pesquisadores do Canadá avaliaram quão bem o ChatGPT diagnosticaria doenças humanas se apresentasse sintomas de pacientes reais, conforme descrito em estudos de casos reais.

Eles escolheram 150 estudos de caso do Medscape, um site online criado e usado por profissionais médicos para fins informativos e educacionais, que foram acompanhados por um diagnóstico preciso e conhecido. Eles treinaram o ChatGPT 3.5 com dados pertinentes, como histórico do paciente, resultados laboratoriais e resultados de exames de consultório, e então solicitaram um diagnóstico e/ou um plano de tratamento.

Depois que a ferramenta retornou uma resposta, a equipe de pesquisa classificou seus resultados com base no quão próximo chegou do diagnóstico correto. Eles também avaliaram o quão bem ele relatou sua justificativa para chegar ao diagnóstico, incluindo a oferta de citações – uma parte importante do diagnóstico médico. Eles então calcularam a média das pontuações recebidas para todos os estudos de caso e os resultados, publicados no site de acesso aberto PLOS ONE, mostraram que o ChatGPT deu um diagnóstico correto apenas 49% das vezes.

Os investigadores observam que, embora o ChatGPT tenha obtido uma pontuação fraca, fez um bom trabalho ao descrever como chegou ao diagnóstico – uma característica que pode ser útil para estudantes de medicina, por exemplo. Eles também observaram que a inteligência artificial era razoavelmente bom em descartar possíveis doenças. No entanto, concluem que essa ferramenta ainda não está pronta para uso em ambientes de diagnóstico.

Um estudo anterior, publicado no JAMA Pediatrics em janeiro, apresentou uma taxa de acerto ainda menor para diagnósticos pediátricos. O trabalho, conduzido por um trio de especialistas do Centro Médico para Crianças Cohen, em Nova York, nos EUA, concluiu que a taxa de acerto para diagnóstico de doenças em crianças foi de somente 17% de acerto, e 83% de erro.

Ainda assim, os pesquisadores ponderam que "a maioria dos diagnósticos incorretos gerados pelo chatbot pertenciam ao mesmo sistema de órgãos do diagnóstico correto (por exemplo, psoríase e dermatite seborreica).

Por outro lado, existem trabalhos que apontam taxas altas de acerto. Um deles, que contou com pesquisadores da Universidade de Harvard, nos Estados Unidos, analisou 36 casos clínicos e apresentou uma precisão de 71,7% ao identificar os diagnósticos. Existem também casos específicos em que a ferramenta foi capaz de dar um diagnóstico preciso, quando médicos falharam.

Um menino foi diagnosticado com uma doença rara pelo ChatGPT depois de em 17 médicos, ao longo de três anos, falharam. Cansada de ver o filho doente e sem uma solução, a mãe compartilhou com o ChatGPT todos os sintomas e dados das ressonâncias magnéticas que a criança realizou ao longo dos anos.

Imediatamente, a ferramenta sugeriu um diagnóstico: síndrome da medula ancorada, condição rara que faz com que a medula vertebral se fixe de forma anormal ao canal, restringindo o fluxo sanguíneo à medida que as crianças crescem. Depois de receber o diagnóstico, o menino passou por uma cirurgia para corrigir a medula e se recupera com sucesso.

Diante disso, especialistas acreditam que há muito potencial para o uso desse tipo da ferramenta na medicina, só não agora. Em reportagem sobre o assunto, especialistas ouvidos pelo GLOBO disseram que nos próximos 10 anos existirá ferramentas tão potentes capazes de analisar informações de exames, históricos de pacientes e dados genéticos para fornecer, com precisão, sugestões de diagnósticos e melhores tratamentos para o profissional.

Mais recente Próxima José Dirceu tem alta hospitalar e seguirá tratamento para obstrução com estatinas

Inscreva-se na Newsletter: Saúde em dia

Mais do Globo

Trabalhador de 28 anos tentava salvar máquinas da empresa e foi engolido pelo fogo

Brasileiro morre carbonizado em incêndio florestal em Portugal

Marçal prestou depoimento nesta segunda-feira (16) sobre o episódio

Novo vídeo: ângulo aberto divulgado pela TV Cultura mostra que Datena tentou dar segunda cadeirada em Marçal

Polícia Civil deve cumprir mandados de prisão contra os suspeitos ainda esta semana

Incêndios florestais no RJ: 20 pessoas são suspeitas de provocar queimadas no estado

Além de estimativas frustradas, ministro diz que comunicação do BC americano levou analistas a vislumbrar possibilidade de subida na taxa básica americana

Haddad vê descompasso nas expectativas sobre decisões dos BCs globais em torno dos juros

Ministro diz que estes gastos fora do Orçamento não representariam violação às regras

Haddad: Crédito extraordinário para enfrentar eventos climáticos não enfraquece arcabouço fiscal

Presidente irá se reunir com chefes do STF e Congresso Nacional para tratar sobre incêndios

Lula prepara pacote de medidas para responder a queimadas

Birmingham e Wrexham estão empatados na liderança da competição

'Clássico de Hollywood': time de Tom Brady vence clube de Ryan Reynolds pela terceira divisão inglesa

Projeto mantém medida integralmente em 2024 e prevê reoneração a partir de 2025

Lula sanciona projeto de desoneração da folha de pagamento de setores intensivos em mão de obra

Empresas de combustível foram investigadas pelo Ministério Público por esquema de fraudes fiscais

Copape e Aster pedem recuperação judicial para tentar reverter cassação de licenças pela ANP