First Proof: 11 matemáticos criam teste de IA com respostas que nunca existiram na internet
Matemáticos de Stanford, Harvard, Columbia, Yale e EPFL criaram First Proof, benchmark de 10 problemas de pesquisa extraídos de trabalhos não publicados em combinatória algébrica, teoria espectral de grafos, geometria simplética e mais. As respostas foram criptografadas e publicadas em 1stproof.org.
GPT-5.2 Pro e Gemini 3.0 DeepThink tiveram dificuldade na maioria dos problemas sob protocolo rigoroso de tentativa única. Como as soluções nunca apareceram na internet, contaminação de dados é impossível.
Ver resumo completo de 17 de fevereiro de 2026