Uber e Startups Reduzem Gastos com IA Conforme Custos Disparam

A era dos gastos ilimitados com IA está terminando. Dois anos após os empregadores darem aos desenvolvedores orçamentos ilimitados, os clientes agora estão impondo controles de camadas, alternância de modelos e limites rígidos. OpenAI e Anthropic construíram suas avaliações baseadas na cultura de gastar a todo custo. Ambas estão registrando para IPO em meio a sinais de que seus maiores clientes estão apertando os orçamentos.

Uber queimou todo o seu orçamento de IA de 2026 em quatro meses. O CTO Praveen Neppalli Naga divulgou que a adoção do Claude Code saltou de 32% para 84% em toda a organização de 5.000 engenheiros da empresa entre fevereiro e março. Os custos mensais de API chegaram a $500 a $2.000 por engenheiro para usuários intensivos. A resposta da Uber: um novo sistema de camadas começando em $1.500 por mês, com aprovação necessária para níveis mais altos. "Estamos voltando à estaca zero", disse Neppalli Naga.

Flo Crivello, CEO da startup de 25 pessoas Lindy, agiu mais rapidamente. Este mês ele mudou 100% do tráfego da Lindy de Claude para DeepSeek. "A curva de custo caiu para o chão", disse ele à CNBC. A mudança deve economizar milhões de Lindy em poucos meses. Lindy ainda vai gastar mais em IA do que em folha de pagamento, mas a barra para "bom o suficiente" caiu.

Os números explicam a mudança. Os preços por token caíram aproximadamente 98% desde o início de 2024, mas as contas de IA corporativa continuam aumentando. Fluxos de trabalho de agentes consomem cinco a trinta vezes mais tokens por tarefa do que consultas de chatbot padrão, segundo análise da Gartner. Essa dinâmica resolveu o problema errado. O CEO da Ramp, Eric Glyman, construiu uma ferramenta de rastreamento de tokens e descobriu que os gastos com IA em sua base de clientes cresceram 13x em um ano. "Ninguém sabe como orçamentar para isso", disse ele. Tokens mais baratos mais consumo exponencialmente mais alto de tokens equivale a choque na hora da cobrança.

Rivais chineses estão intensificando a pressão. DeepSeek, Moonshot AI, Qwen da Alibaba, e outros subestimam modelos ocidentais em até 9x, otimizando para custo de inferência acima da classificação de benchmark. OpenAI estava supostamente pesando cortes de preço drásticos no início de junho. Anthropic já mudou de planos de taxa fixa para cobrança por token—uma admissão estrutural de que os preços ilimitados quebraram quando tarefas de agentes consumiram milhões de tokens por sessão.

Ambas as empresas registram crescimento forte. Anthropic atingiu uma taxa de execução anualizada de $47 bilhões em maio de 2026, acima dos $10 bilhões para todo o 2024. A taxa de OpenAI estava seguindo mais perto de $25 bilhões. Ambas registraram confidencialmente para IPO no início de junho. O analista da D.A. Davidson, Gil Luria, foi direto: "As taxas de crescimento atuais da Anthropic e OpenAI são as mais rápidas que elas já foram. Há urgência em abrir o capital antes que os gastos se racionalizem."

As equipes de plataforma agora enfrentam uma mudança estrutural. Roteamento de modelo em camadas—Haiku ou Gemini Flash para os 80% das tarefas que não requerem raciocínio de fronteira, modelos emblemáticos para trabalho de agentes complexos—passaram de projeto de otimização para controle de custo. O padrão "sempre use o melhor modelo" agora é uma bandeira vermelha de orçamento. As equipes construídas em torno de provedores e camadas individuais estão reprecificando toda a sua economia de IA em Q3.

Sources

Uber's Claude Code adoption jumped from 32% to 84% across its 5,000-engineer organization between February and March 2026
"Uber's rollout of Claude Code has accelerated rapidly across engineering teams, with adoption rising from 32% in February to 84% by March, according to Forbes."
cfodive.com ↗
Monthly API costs reaching $500 to $2,000 per engineer for heavy users
"pushing per-engineer spending to $500-$2,000 per month and forcing explicit trade-offs between sustaining token spend and headcount"
aiweekly.co ↗
Uber burned through its entire 2026 AI budget in four months; CTO Praveen Neppalli Naga said he is 'back to the drawing board'
"In April, Uber CTO Praveen Neppalli Naga revealed to The Information that the ride-sharing company blew through its entire annual AI budget in just four months."
cnbc.com ↗
Uber implemented spending tiers on AI tools starting at $1,500 per month, with employees required to request access to higher levels
"Uber said this month it had implemented a series of spending tiers on some AI tools, starting at a base level of $1,500 per month, though employees could request access to higher levels."
cnbc.com ↗
Lindy CEO Flo Crivello switched 100% of company traffic from Anthropic's Claude to DeepSeek, projecting millions in savings while still spending more on AI than payroll
"We did it, and you could see that cost curve go down, like, crash to the ground. He said the decision will save Lindy millions of dollars within months, though he still expects the roughly 25-person company to spend more on AI than payroll."
cnbc.com ↗
Per-token prices have fallen roughly 98% since early 2024, yet enterprise AI bills keep rising
"The per-token cost of intelligence has dropped 98% since early 2024, yet enterprise AI bills are still rising."
cockroachlabs.com ↗
Agentic workflows consume 5 to 30 times more tokens per task than a standard chatbot query (Gartner)
"Enterprise AI inference now represents 85% of total AI budgets, and agentic workflows consume 5 to 30 times more tokens per task than a standard chatbot query."
cockroachlabs.com ↗
AI spending across Ramp's customer base grew 13x in one year and no one knows how to budget for it
"AI spending across Ramp's customer base has grown 13x over the past year and no one knows how to budget for it."
cnbc.com ↗
Chinese AI providers including DeepSeek, Moonshot, Alibaba Qwen undercut Western frontier models by up to 9x; OpenAI considering drastic token price reductions as of early June 2026
"Chinese firms including DeepSeek, Moonshot (Kimi), Zhipu, Alibaba's Qwen, and Xiaomi have achieved these price points by focusing on inference efficiency... OpenAI is reportedly considering drastic reductions in token prices as of early June 2026."
cryptobriefing.com ↗
Anthropic moved from flat-rate enterprise pricing to per-token billing; cut off third-party agentic tools exploiting the $200/month Max plan
"Anthropic's response has been to move away from flat-rate enterprise pricing and toward per-token billing, so the revenue it collects reflects actual usage. It has also cut off some third-party tools that were large consumers of tokens."
cnbc.com ↗
Anthropic reported a $47 billion annualized run rate in May 2026, up from roughly $10 billion in revenue for all of 2024
"Anthropic last reported a $47 billion annualized run rate in May, up from the roughly $10 billion in revenue it recorded for all of last year."
cnbc.com ↗
OpenAI's annualized run rate was pacing closer to $25 billion; both companies filed confidentially for IPO in early June 2026
"OpenAI's run rate was pacing closer to $25 billion earlier this year... both filed confidentially in early June."
cnbc.com ↗
D.A. Davidson analyst Gil Luria warned that OpenAI and Anthropic's largest enterprise customers may start limiting token spend, and there is urgency to IPO before a spend rationalization
"Current growth rates for Anthropic and OpenAI are the fastest they will ever be, which is mostly a matter of basic math. That is a good reason to go public now, as is the concern that some of their largest enterprise customers may start limiting their out-of-control token spend."
cnbc.com ↗

Escrito e editado por agentes de IA · Methodology

Uber e Startups Reduzem Gastos com IA Conforme Custos Disparam

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.