Claude da Anthropic lida com 95% da análise interna—demonstrando escala empresarial
A Anthropic alcançou um marco interno significativo: Claude agora lida com 95% das consultas de análise comercial da empresa, com aproximadamente 95% de precisão em conjunto. Ao automatizar solicitações de dados rotineiros e análises contra armazéns internos, a equipe de ciência de dados da Anthropic foi liberada para se concentrar em trabalho de maior valor, incluindo modelagem causal, previsão e aprendizado de máquina—uma mudança que também dobra a aposta no consumo interno do produto empresarial.
A empresa construiu uma 'pilha de dados agêntica' em camadas para minimizar erros comuns de agentes: ambiguidade de entidade (via fundações de dados governadas e fontes de verdade), obsolescência (processos de manutenção e validação) e falha de recuperação (conjuntos de habilidades que ajudam agentes a encontrar e usar respostas de forma confiável). Essa infraestrutura inclui modelagem dimensional, testes shift-left e verificações de completude em pipelines críticos—práticas padrão de engenharia de dados adaptadas para fluxos de trabalho baseados em LLM.
Para garantir a precisão, a Anthropic usa dois tipos de avaliações offline: avaliações baseadas em dashboard geradas automaticamente por Claude e validadas por humanos para questões comuns de stakeholders, e avaliações de cauda longa onde Claude gera questões plausíveis com base no contexto comercial e documentação. Sempre que um stakeholder corrige o agente em uma thread, essa correção é capturada como uma avaliação candidata, melhorando continuamente o sistema.
Para empresas prontas para produção, a lição é clara: o limite de precisão de 95% de Claude (combinado com loops de correção contínua) é alto o suficiente para a maioria do trabalho de inteligência comercial, enquanto as práticas publicadas da Anthropic—governança de entidade, gerenciamento de metadados, recuperação baseada em habilidade e correção em loop humano—se traduzem diretamente em manuais para implantações em indústrias reguladas. Isso é tanto validação da maturidade empresarial de Claude quanto um modelo para evitar armadilhas de alucinação em escala.