Consumo de tokens de IA agentic atinge 1.000x a linha de base, disparando retirada de custos na Microsoft, Meta, Amazon
Sistemas de IA agentic estão consumindo até 1.000 vezes mais tokens que modelos padrão, criando uma crise de custos galopante dentro de grandes empresas de tecnologia. 'Tokenmaxxing' de funcionários—executando fluxos de trabalho agentic sem supervisão—backfired, forçando Microsoft, Meta e Amazon a reduzir as implantações de IA agentic e implementar orçamentos de tokens mais rigorosos.
A retirada sinala um gargalo estrutural: a economia de inferência em escala massiva ainda não suporta fluxos de trabalho de agentes autônomos. Para equipes de infraestrutura, isso marca um reset nas expectativas de ROI de capex e uma mudança temporária em direção à otimização de latência e eficiência sobre o puro throughput.