GPT-5: modelo da OpenAI apresenta queda nas alucinações
A OpenAI anunciou o lançamento do GPT-5, sucessor do GPT-4o, destacando avanços em velocidade, capacidade de raciocínio e redução de erros factuais. A empresa afirma que a nova versão erra em 9,6 % das respostas, ante 12,9 % do modelo anterior, o que representa diminuição de 26 % na taxa de alucinação.
Taxas de alucinação caem 26 % em relação ao GPT-4o
Segundo o cartão de sistema divulgado pela OpenAI, o GPT-5 produziu 44 % menos respostas com pelo menos um erro factual grave quando comparado ao GPT-4o. Nas medições internas, o modelo padrão registrou alucinações em 9,6 % das saídas, enquanto a versão de raciocínio ampliado, denominada GPT-5-thinking, ficou em 4,5 %.
Em testes paralelos, os modelos de raciocínio o3 e o4-mini, lançados anteriormente, apresentaram 12,7 % e 12,9 % de erros, respectivamente. A comparação indica avanço consistente, embora a OpenAI reconheça que cerca de uma em cada dez respostas ainda possa conter imprecisões.
Metodologia de testes: com e sem acesso à web
A avaliação de alucinações foi realizada em dois cenários. No primeiro, os modelos tiveram acesso à navegação na web, permitindo consulta a fontes externas. Nesse ambiente, o GPT-5 e o GPT-5-thinking obtiveram os melhores resultados, superando os concorrentes internos.
No segundo cenário, a OpenAI utilizou o benchmark interno Simple QA, composto por perguntas factuais curtas e sem acesso à internet. Nessa prova, as alucinações aumentaram de forma expressiva: 47 % no GPT-5, 40 % no GPT-5-thinking, 46 % no o3 e 52 % no GPT-4o. A empresa concluiu que a conexão com dados atualizados segue fundamental para mitigar erros.
Diferenças entre GPT-5 e GPT-5-thinking
O GPT-5-thinking aplica mais capacidade de computação a cada pergunta, estratégia que reduziu a taxa de alucinação para 4,5 % com navegação habilitada. Porém, sem web, o índice subiu para 40 %. A discrepância reforça que poder de processamento não elimina a necessidade de acesso a informações confiáveis.

Imagem: mashable.com
Possíveis impactos em aplicações de saúde
A OpenAI destaca o setor de saúde como um dos principais beneficiados pela nova geração do modelo. Entretanto, os dados mostram que, mesmo com redução de erros, ainda existem riscos relevantes. Em um contexto onde informações imprecisas podem comprometer diagnósticos ou orientações médicas, a taxa de 9,6 % de respostas equivocadas exige validação humana permanente.
Falha identificada durante demonstração pública
Logo após o anúncio, usuários localizaram um deslize no próprio evento de demonstração. Beth Barnes, fundadora da organização METR, observou que o GPT-5 explicou incorretamente o funcionamento da sustentação de aeronaves, atribuindo o fenômeno ao Efeito Bernoulli de forma simplificada e equivocada. O caso ilustra que, apesar dos progressos, o modelo continua sujeito a afirmações erradas apresentadas com confiança.
Contexto do desafio técnico
Alucinações ocorrem porque grandes modelos de linguagem são treinados para prever a próxima palavra mais provável, baseando-se em enormes conjuntos de dados. Essa característica faz com que eles, por vezes, gerem frases plausíveis porém imprecisas. Pesquisadores apontam que o fenômeno pode ser inerente à arquitetura dos LLMs, sendo reduzido, mas não totalmente eliminado, por meio de dados melhores, ajustes de treinamento e maior poder computacional.
Orientação ao usuário final
Enquanto a taxa de erros não atinge níveis residuais, a recomendação da própria OpenAI é ativar a busca na web sempre que possível e, em tarefas críticas, checar manualmente as respostas. A tendência é que novas versões recebam ajustes contínuos, mas o lançamento do GPT-5 confirma que a mitigação de alucinações avança de forma incremental.
{
“@context”: “https://schema.org”,
“@type”: “NewsArticle”,
“headline”: “OpenAI lança GPT-5 com promessa de 26% menos alucinações em respostas”,
“description”: “OpenAI apresenta GPT-5 com redução de erros factuais, comparações detalhadas de taxas de alucinação e impacto em usos críticos como saúde.”,
“mainEntityOfPage”: {
“@type”: “WebPage”,
“@id”: “”
}
}