El consumo de tokens de IA agentic alcanza 1.000x la línea de base, desencadenando una reducción de costos en Microsoft, Meta, Amazon
Los sistemas de IA agentic están consumiendo hasta 1.000 veces más tokens que los modelos estándar, creando una crisis de costos descontrolada dentro de grandes empresas tecnológicas. El 'tokenmaxxing' de empleados—ejecutar flujos de trabajo agentic sin supervisión—ha sido contraproducente, obligando a Microsoft, Meta y Amazon a reducir los despliegues de IA agentic e implementar presupuestos de tokens más estrictos.
La reducción señala un cuello de botella estructural: la economía de inferencia a escala masiva aún no respalda flujos de trabajo de agentes autónomos. Para los equipos de infraestructura, esto marca un reinicio en las expectativas de ROI de capex y un cambio temporal hacia la optimización de latencia y eficiencia sobre el puro rendimiento.