Olá! Quer uma ajudinha para descobrir sua faculdade ideal?
Vestibular e Enem

Enem 2025: testamos o ChatGPT, Gemini e Grok para fazer o 2º dia da prova; veja quem acertou mais!

As inteligências artificiais enfrentaram as questões de Matemática e Ciências da Natureza no segundo domingo do Enem 2025.

Veja quem foi melhor, quais erros chamaram atenção e como cada modelo se saiu na prova mais técnica do exame.

Em resumo:

  • O ChatGPT demonstrou a maior precisão, liderando com 56 acertos. Seguidos do Gemini (50) e Grok (33).
  • As IAs tiveram dificuldade para análise e interpretação de gráficos.
  • Em comparação ao primeiro dia de Enem, houve menor número de acertos.

O segundo dia do Enem 2025 reuniu 45 questões de Matemática e 45 de Ciências da Natureza — e, assim como fizemos no primeiro dia, colocamos ChatGPT, Gemini e Grok para responderem todas as perguntas.

Os modelos de IA passaram por desafios de cálculo, interpretação gráfica, leitura de tabelas e resolução de problemas.

E os resultados mostram diferenças importantes entre como cada sistema lida com lógica, números e análise científica.

Veja como foi o experimento!

Encontre bolsas de estudo de até 80%

Como fizemos o teste com as IAs no 2º dia do Enem 2025?

Para tornar o experimento o mais equilibrado possível, utilizamos apenas as versões gratuitas de cada inteligência artificial — as mesmas disponíveis ao público, sem assinatura ou recursos avançados.

Os modelos avaliados foram:

ChatGPT (OpenAI): assistente amplamente utilizado, conhecido pela capacidade de lidar com diferentes tipos de perguntas e por priorizar respostas claras e seguras.

Gemini (Google): sistema integrado ao ecossistema do Google, com foco em interpretar contexto e relacionar informações de forma detalhada.

Grok (xAI): modelo da equipe de Elon Musk, marcado por respostas rápidas e diretas, com traços de espontaneidade característicos da plataforma.

Capa da Prova Cinza do Enem 2025, segundo dia.

Todas as IAs receberam exatamente as mesmas questões do Enem 2025, utilizando a prova cinza como base.

Para padronizar a análise, aplicamos o mesmo prompt em todas as plataformas:

“Chat, crie uma correção da prova do ENEM para o público em geral, como um professor faria.
Leia o enunciado, interprete imagens e gráficos, analise as alternativas e finalize indicando a alternativa correta.
Vou enviar a prova em partes. Responda com o número da questão e a letra correspondente.
Comente apenas se for realmente necessário.”

A prova foi enviada segmentada para cada IA, seguindo a mesma ordem e o mesmo formato.

A verificação das respostas considerou o gabarito extraoficial divulgado pela Quero Bolsa em parceria com o Curso Anglo.

É importante reforçar que o objetivo não é produzir um estudo científico, mas observar como diferentes modelos de IA interpretam textos, imagens e contextos — elementos essenciais na estrutura do Enem.

Como cada IA se comportou nas questões de Matemática e Ciências da Natureza?

A avaliação comparativa do desempenho das IAs na resolução de questões objetivas no segundo dia do Enem 2025 que requeriam interpretação de contexto visual complexo revelou diferenças notáveis na velocidade de processamento, na capacidade de análise de imagens e na coerência da resposta.

As questões, abrangendo Matemática e Ciências da Natureza, exigiram a leitura e o uso eficiente de gráficos, diagramas e figuras para a obtenção das soluções.

O contraste entre os modelos pode ser claramente observado nos fatores de tempo de resposta, na facilidade de leitura de imagens e na manutenção da coerência lógica ao longo da interação.

ModeloTempo de RespostaFacilidade com ImagensCoerência e Estrutura da Resposta
ChatGPTMaiorDemonstrou dificuldade, solicitando mais detalhes para visualizar questões com imagens específicas.Respostas completas, mas com atraso devido à dificuldade de interpretação visual.
GeminiRápidoAnálise rápida das imagens.Apresentou problemas de coerência, em certo momento, confundindo as questões e respondendo a itens anteriores já tratados.
GrokRápidoSem dificuldade com as imagens das questões.Resposta rápida e explicação breve.

Saiba mais:

+ Enem 2025: colocamos ChatGPT, Gemini e Grok pra fazer a prova; veja quem foi melhor!

++ O ChatGPT acertaria todas as questões do segundo dia do Enem?

Desafios específicos do 2º dia do Enem para as IAs

As questões do segundo dia do Enem apresentam características que podem ser mais difíceis para inteligências artificiais do que para humanos:

  • Cálculo em múltiplas etapas, que exige precisão operacional.
  • Interpretação de gráficos e tabelas, comuns em questões de Física, Química e Biologia.
  • Problemas contextualizados, que relacionam fenômenos naturais com situações cotidianas.
  • Enunciados longos com dados numéricos, onde pequenos deslizes geram erros grandes.

Veja abaixo algumas dificuldades em que as IAs tiveram para correção da prova no 2° dia do Enem 2025.

ChatGPT teve dificuldade para processar imagem referente a questão 121.
Imagem 01: ChatGPT teve dificuldade para processar imagem referente a questão 121.
Grok sinaliza possível erro entre as alternativas na questão 115.
Imagem 02: Grok sinaliza possível erro entre as alternativas na questão 115.

Mas afinal, quem acertou mais respostas do Enem?

O ChatGPT foi o mais preciso, o Gemini apresentou um desempenho de precisão intermediário com falhas de coerência, e o Grok foi o mais rápido e eficiente com baixa precisão.

IAAcertos
ChatGPT56
Gemini50
Grok33

A análise da performance das IAs na resolução das questões que envolviam Matemática e Ciências da Natureza revela uma clara diferença na precisão (acertos) e na eficiência operacional de cada modelo.

O ChatGPT demonstrou a maior precisão, liderando com 56 acertos. Isso sugere uma forte capacidade analítica e de raciocínio lógico, apesar de sua baixa eficiência operacional (tempo de resposta maior) e da dificuldade em visualizar e processar as informações contidas nas imagens.

O Gemini ficou em segundo lugar em precisão, com 50 acertos. Embora tenha mostrado rapidez na análise das imagens, sua performance foi prejudicada por problemas de coerência e memória conversacional, levando-o a confundir questões já respondidas.

O Grok apresentou o menor número de acertos (33), indicando a menor capacidade de acurácia entre os modelos. No entanto, sua principal vantagem reside na eficiência de uso, caracterizada pela resposta rápida e pela facilidade em processar as imagens sem dificuldades, o que sugere que, apesar da baixa precisão, ele é o modelo mais ágil e direto na entrega da informação.

Como estudar com bolsa de estudo

Está de olho na oportunidade de estudar e quer saber como fazer isso pagando mensalidades mais em conta?

A Quero Bolsa, uma plataforma que oferece bolsas de estudo de até 80% em mais de 1.000 instituições de ensino espalhadas por todo o Brasil, pode ajudar você a transformar isso em realidade.

Entenda como funciona a Quero Bolsa

Se você se interessou e quer saber mais sobre como ela funciona, confira abaixo alguns artigos e entenda melhor como conseguir uma bolsa!

Onde estudar com desconto

Confira abaixo algumas das melhores instituições de ensino do Brasil que são parceiras da Quero Bolsa e aproveitar as ofertas disponíveis.

Gostando dessa matéria?

Inscreva-se e receba nossos principais posts no seu e-mail

Personagem segurando um sino de notificações