OpenAI publica tentativas de prova no desafio matemático First Proof
A OpenAI compartilhou tentativas de prova de seu modelo de IA para o desafio matemático First Proof, testando raciocínio de nível de pesquisa em problemas matemáticos avançados. As submissões avaliam se modelos de fronteira conseguem gerar provas matemáticas válidas.
O desafio vai além de benchmarks padrão, exigindo raciocínio lógico rigoroso — uma capacidade que permanece inconsistente mesmo nos modelos mais avançados.
Ver resumo completo de 21 de fevereiro de 2026