Grok 4.1 da xAI reduz alucinações e aumenta precisão nas respostas

A xAI lançou, na segunda-feira (17), a versão Grok 4.1, que promete menos alucinações em suas respostas. A atualização visa tornar as interações mais naturais e precisas, priorizando melhorias em inteligência emocional, criatividade na escrita e exatidão factual.

Com a nova versão, o Grok 4.1 alcançou 64,8% de preferência em testes às cegas em comparação ao Grok 4.0 e se posicionou como líder no ranking da LMArena, superando concorrentes como Google, Anthropic e OpenAI. Esse avanço em percepção emocional é refletido nos resultados do EQ-Bench, um indicador de inteligência emocional.

O TechTudo realizou diversos testes com a nova versão da IA, partindo de perguntas diretas até questionamentos sobre temas atuais. Em um primeiro teste, perguntou-se qual estado brasileiro não possui a letra 'A', e a resposta foi direta e correta. Em outro, o Grok 4.1 demonstrou estar atualizado ao responder sobre as mudanças no Bolsa Família em 2025, oferecendo uma resposta abrangente que incluía tanto o que permaneceu inalterado quanto as novas informações.

Além disso, questões factuais como a data de nascimento da atriz Fernanda Montenegro foram também respondidas corretamente, com informações complementares pertinentes. O desempenho foi igualmente satisfatório ao analisar um artigo do TechTudo, onde a IA acertou na identificação de conteúdo e apresentou apenas uma resposta incompleta, que poderia ter sido evitada com uma formulação diferente da pergunta.

Os testes revelaram que o Grok 4.1 realmente apresenta menos alucinações, com uma taxa de respostas alucinadas de 4,22%, inferior ao anterior 12,09%. Embora a ferramenta tenha sido eficaz em grande parte, a recomendação permanece de que os usuários verifiquem a veracidade das informações apresentadas.

Tags