Agentes de IA podem impulsionar demanda de tokens em 24x, aumentando custos de inferência de LLM: Goldman Sachs
Análise do Goldman Sachs alerta que adoção generalizada de agentes de IA poderia aumentar consumo de tokens em até 24 vezes os níveis atuais, aumentando materialmente custos de inferência para empresas. Empresas incluindo Uber e Microsoft já estão absorvendo faturamento elevado em modelos de preço baseados em tokens.
A descoberta sinaliza uma tensão que virá: sistemas agênticos exigem mais computação por tarefa, mas prometem ROI mais alto através de tomada de decisão autônoma. CIOs orçando para implantação multi-modelo precisarão modelar taxas de queima de tokens e negociar preços de volume com provedores antes que agentes escalem em toda a produção.