AT&T corta custos de IA em 90% ao substituir modelos grandes por agentes menores
A AT&T reconstruiu sua camada de orquestração de IA para processar 8 bilhões de tokens por dia, substituindo chamadas a modelos grandes por uma arquitetura multi-agente onde "superagentes" LLM direcionam "agentes trabalhadores" menores. A abordagem reduziu custos em até 90% sem perder precisão.
O chief data officer Andy Markus disse que modelos menores igualam a precisão de LLMs em tarefas específicas de domínio. A equipe usou a nova arquitetura com o Microsoft Azure para criar o Ask AT&T Workflows, um construtor drag-and-drop de agentes para funcionários.
Ver resumo completo de 26 de fevereiro de 2026