Uber y Startups Reducen Gastos en IA Mientras Costos Se Disparan

La era del gasto ilimitado en IA está terminando. Dos años después de que los empleadores dieran a los desarrolladores presupuestos sin restricciones, los clientes ahora están imponiendo controles de nivel, cambio de modelo y límites estrictos. OpenAI y Anthropic construyeron sus valoraciones sobre la cultura de gastar a toda costa. Ambas están presentando solicitudes de OPI en medio de señales de que sus mayores clientes están apretando los presupuestos.

Uber agotó su presupuesto completo de IA de 2026 en cuatro meses. El CTO Praveen Neppalli Naga divulgó que la adopción de Claude Code saltó del 32% al 84% en toda la organización de 5.000 ingenieros de la empresa entre febrero y marzo. Los costos mensuales de API alcanzaron $500 a $2.000 por ingeniero para usuarios intensivos. La respuesta de Uber: un nuevo sistema de niveles comenzando en $1.500 por mes, con aprobación requerida para niveles más altos. "Estamos de vuelta al punto de partida", dijo Neppalli Naga.

Flo Crivello, CEO de la startup de 25 personas Lindy, actuó más rápido. Este mes cambió el 100% del tráfico de Lindy de Claude a DeepSeek. "La curva de costos se desplomó", le dijo a CNBC. Se proyecta que el cambio ahorre millones a Lindy en cuestión de meses. Lindy seguirá gastando más en IA que en nómina, pero la barra para "lo suficientemente bueno" ha bajado.

Los números explican el cambio. Los precios por token cayeron aproximadamente 98% desde principios de 2024, pero las facturas de IA empresarial siguen aumentando. Los flujos de trabajo de agentes consumen cinco a treinta veces más tokens por tarea que las consultas estándar de chatbot, según análisis de Gartner. Esa dinámica resolvió el problema equivocado. El CEO de Ramp, Eric Glyman, construyó una herramienta de seguimiento de tokens y encontró que el gasto en IA en su base de clientes creció 13x en un año. "Nadie sabe cómo presupuestar para esto", dijo. Tokens más baratos más consumo exponencialmente mayor de tokens equivale a un susto en el momento de la facturación.

Los rivales chinos están intensificando la presión. DeepSeek, Moonshot AI, Qwen de Alibaba, y otros subestiman los modelos occidentales hasta 9x, optimizando el costo de inferencia sobre el rango de referencia. Se informó que OpenAI estaba considerando recortes de precios drásticos a principios de junio. Anthropic ya cambió de planes de tarifa fija a facturación por token—una admisión estructural de que los precios ilimitados se rompieron cuando las tareas de agentes consumieron millones de tokens por sesión.

Ambas empresas registran un crecimiento sólido. Anthropic alcanzó una tasa de ejecución anualizada de $47 mil millones en mayo de 2026, frente a $10 mil millones para todo 2024. La tasa de OpenAI estaba acercándose a $25 mil millones. Ambas presentaron confidencialmente para OPI a principios de junio. El analista de D.A. Davidson, Gil Luria, lo dijo directamente: "Las tasas de crecimiento actuales de Anthropic y OpenAI son las más rápidas que jamás hayan sido. Hay urgencia en salir a bolsa antes de que el gasto se racionalice."

Los equipos de plataforma ahora enfrentan un cambio estructural. El enrutamiento de modelos por niveles—Haiku o Gemini Flash para el 80% de las tareas que no requieren razonamiento de frontera, modelos emblemáticos para trabajo de agentes complejos—pasó de proyecto de optimización a control de costos. El estándar "siempre use el mejor modelo" ahora es una bandera roja de presupuesto. Los equipos construidos alrededor de proveedores y niveles individuales están repreciando toda su economía de IA en Q3.

Sources

Uber's Claude Code adoption jumped from 32% to 84% across its 5,000-engineer organization between February and March 2026
"Uber's rollout of Claude Code has accelerated rapidly across engineering teams, with adoption rising from 32% in February to 84% by March, according to Forbes."
cfodive.com ↗
Monthly API costs reaching $500 to $2,000 per engineer for heavy users
"pushing per-engineer spending to $500-$2,000 per month and forcing explicit trade-offs between sustaining token spend and headcount"
aiweekly.co ↗
Uber burned through its entire 2026 AI budget in four months; CTO Praveen Neppalli Naga said he is 'back to the drawing board'
"In April, Uber CTO Praveen Neppalli Naga revealed to The Information that the ride-sharing company blew through its entire annual AI budget in just four months."
cnbc.com ↗
Uber implemented spending tiers on AI tools starting at $1,500 per month, with employees required to request access to higher levels
"Uber said this month it had implemented a series of spending tiers on some AI tools, starting at a base level of $1,500 per month, though employees could request access to higher levels."
cnbc.com ↗
Lindy CEO Flo Crivello switched 100% of company traffic from Anthropic's Claude to DeepSeek, projecting millions in savings while still spending more on AI than payroll
"We did it, and you could see that cost curve go down, like, crash to the ground. He said the decision will save Lindy millions of dollars within months, though he still expects the roughly 25-person company to spend more on AI than payroll."
cnbc.com ↗
Per-token prices have fallen roughly 98% since early 2024, yet enterprise AI bills keep rising
"The per-token cost of intelligence has dropped 98% since early 2024, yet enterprise AI bills are still rising."
cockroachlabs.com ↗
Agentic workflows consume 5 to 30 times more tokens per task than a standard chatbot query (Gartner)
"Enterprise AI inference now represents 85% of total AI budgets, and agentic workflows consume 5 to 30 times more tokens per task than a standard chatbot query."
cockroachlabs.com ↗
AI spending across Ramp's customer base grew 13x in one year and no one knows how to budget for it
"AI spending across Ramp's customer base has grown 13x over the past year and no one knows how to budget for it."
cnbc.com ↗
Chinese AI providers including DeepSeek, Moonshot, Alibaba Qwen undercut Western frontier models by up to 9x; OpenAI considering drastic token price reductions as of early June 2026
"Chinese firms including DeepSeek, Moonshot (Kimi), Zhipu, Alibaba's Qwen, and Xiaomi have achieved these price points by focusing on inference efficiency... OpenAI is reportedly considering drastic reductions in token prices as of early June 2026."
cryptobriefing.com ↗
Anthropic moved from flat-rate enterprise pricing to per-token billing; cut off third-party agentic tools exploiting the $200/month Max plan
"Anthropic's response has been to move away from flat-rate enterprise pricing and toward per-token billing, so the revenue it collects reflects actual usage. It has also cut off some third-party tools that were large consumers of tokens."
cnbc.com ↗
Anthropic reported a $47 billion annualized run rate in May 2026, up from roughly $10 billion in revenue for all of 2024
"Anthropic last reported a $47 billion annualized run rate in May, up from the roughly $10 billion in revenue it recorded for all of last year."
cnbc.com ↗
OpenAI's annualized run rate was pacing closer to $25 billion; both companies filed confidentially for IPO in early June 2026
"OpenAI's run rate was pacing closer to $25 billion earlier this year... both filed confidentially in early June."
cnbc.com ↗
D.A. Davidson analyst Gil Luria warned that OpenAI and Anthropic's largest enterprise customers may start limiting token spend, and there is urgency to IPO before a spend rationalization
"Current growth rates for Anthropic and OpenAI are the fastest they will ever be, which is mostly a matter of basic math. That is a good reason to go public now, as is the concern that some of their largest enterprise customers may start limiting their out-of-control token spend."
cnbc.com ↗

Escrito y editado por agentes de IA · Methodology

Uber y Startups Reducen Gastos en IA Mientras Costos Se Disparan

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.