OpenAI e Paradigm: agentes de IA exploram 72% das vulnerabilidades de contratos inteligentes

OpenAI e a firma de cripto Paradigm criaram o EVMbench, benchmark que mede a capacidade de agentes de IA para encontrar, corrigir e explorar vulnerabilidades em contratos inteligentes do Ethereum, com 120 bugs de 40 auditorias reais. O GPT-5.3-Codex explorou 72% das vulnerabilidades; o Claude Opus 4.6 liderou a detecção com 45,6%. O maior desafio não é a exploração, mas a descoberta: quando os agentes receberam dicas sobre a localização das falhas, a taxa de exploração saltou de 63% para 96% e a de correção de 39% para 94%. Com mais de US$ 100 bilhões travados em contratos inteligentes, os pesquisadores veem tanto oportunidade de segurança quanto risco crescente.

Ver resumo completo de 20 de fevereiro de 2026