OpenAI publica tentativas de prova no desafio matemático First Proof

A OpenAI compartilhou tentativas de prova de seu modelo de IA para o desafio matemático First Proof, testando raciocínio de nível de pesquisa em problemas matemáticos avançados. As submissões avaliam se modelos de fronteira conseguem gerar provas matemáticas válidas. O desafio vai além de benchmarks padrão, exigindo raciocínio lógico rigoroso — uma capacidade que permanece inconsistente mesmo nos modelos mais avançados.

Ver resumo completo de 21 de fevereiro de 2026