Guide Labs libera Steerling-8B, LLM interpretável com rastreamento de saídas

A Guide Labs lançou o Steerling-8B, um LLM de 8 bilhões de parâmetros com arquitetura que torna cada token gerado rastreável até seus dados de treinamento. Uma camada conceitual categoriza os dados em grupos rastreáveis, permitindo entender por que o modelo produz determinadas saídas e controlar comportamentos como codificação de gênero. O cofundador iniciou essa pesquisa durante o doutorado no MIT, coautorando em 2018 um artigo que mostrava que métodos de interpretabilidade existentes eram pouco confiáveis. A abordagem inverte a interpretabilidade tradicional: em vez de "neurociência posterior" no modelo, a transparência é embutida desde a arquitetura.

Ver resumo completo de 24 de fevereiro de 2026