Gasto de token de IA disparando fora de controle; Accenture pede guardrails
Áudio vaza da Accenture revelando que o gasto de token de IA empresarial está crescendo exponencialmente e de forma imprevisível, levando a discussões internas sobre contenção de custos. O chefe de estratégia de IA agentica da Accenture, Justive Kwak, contou ao pessoal que conforme as empresas passam de chatbots simples para fluxos de trabalho agenticos em toda a empresa e ferramentas como Copilot, Claude Code e Codex, "escalação rápida no gasto de token de IA" está se tornando um impulsionador de custo material e "não um problema nicho. É um problema que toda empresa enfrentará se for otimista sobre IA." Lideranças em nível de CFO, COO e CIO estão perguntando se o gasto se traduz em ROI mensurável.
O problema é agudo porque os custos de token são imprevisíveis e difíceis de controlar: as empresas não podem saber com antecedência quantos tokens uma tarefa consumirá, se o resultado estará correto na primeira tentativa, ou quanto tempo as respostas levarão. Pessoal não técnico, não engenheiros, está impulsionando muito do overspend. Tarefas triviais (conversão de PDF para markdown, loops de resumo) estão queimando tokens desnecessariamente. Amazon reportedly shuttered seu leaderboard de IA em meio ao gasto descontrolado; Uber está limitando o uso de IA de funcionários; múltiplos CEOs e empresas estão mudando para modelos mais baratos e monitoramento mais rigoroso.
Para construtores de infraestrutura, a volatilidade de gasto de token é um indicador líder de econômicas de unidade de IA sob estresse. Quando empresas não conseguem atribuir valor ao consumo, elas não estão otimizando escolhas de stack—elas estão cortando indiscriminadamente. Observe se modelos de faturamento baseados em uso (LLM APIs, bancos de dados vetoriais, compute) mudam para alternativas de custo fixo ou baseado em capacidade conforme CFOs exigem previsibilidade. Isso pode remodelar design de API, estratégias de precificação, e o fosso competitivo de plataformas intensivas em consumo como OpenAI e Anthropic.
Fontes
- Primary source
- tomshardware.com
“rapid escalation in AI token spend... It is a problem that every enterprise will face if they are bullish on AI”