Uber esgotou seu orçamento de IA de 2026 em quatro meses após implantar Claude Code para 5.000 engenheiros em dezembro. O presidente e COO Andrew Macdonald disse no podcast Rapid Response: "Esse vínculo ainda não existe", descrevendo a ausência de uma ligação clara entre consumo de tokens e features entregues. "É muito difícil traçar uma linha entre uma desses stats e 'Tudo bem, agora estamos produzindo 25% mais features úteis para o consumidor.'"
O CTO Praveen Naga chamou isso de um "momento de explodir a cabeça". Em março, 84% dos desenvolvedores eram usuários de codificação agentic. Em abril, 95% dos engenheiros usavam ferramentas de IA mensalmente. 70% do código commitado veio de IA. 11% das atualizações de backend ao vivo foram executadas por agentes de IA com zero revisão humana. Os custos de IA aumentaram seis vezes desde 2024 em relação a uma base de P&D anual de $3,4 bilhões.
Os preços baseados em consumo do Claude Code não têm limites por engenheiro. O custo mensal por engenheiro ficou em média de $150–$250; usuários pesados pagaram $500–$2.000. Com 5.000 engenheiros, o gasto agregado mensal variou de $2,5 milhões a $10 milhões. GitHub Copilot cobra $10–$39 por assento mensalmente, valor fixo. Os rankings internos da Uber classificavam engenheiros pelo uso de IA, incentivando consumo máximo por design. Mais tokens equivaliam a uma pontuação mais alta.
Naga disse: "Estou de volta à estaca zero porque o orçamento que achei que precisaria já foi esgotado". O CEO Dara Khosrowshahi divulgou que a Uber estava desacelerando contratações para compensar o aumento do investimento em IA. A maioria das ROI das empresas conta licenças de assento, não custos de tokens. A experiência da Uber mostra o que acontece quando você paga a conta real.
As métricas de saída de engenharia da Uber melhoraram—mais commits, maior utilização de IA, iteração mais rápida. A contagem de features voltadas para o consumidor não acompanhou na mesma proporção. A desconexão reflete tanto uma falha de medição (proxies de produtividade interna não mapeiam para velocidade de produto) quanto uma pergunta genuína: se as ferramentas de codificação agentic comprimem o tempo para deploy ou apenas comprimem o tempo para escrever código que ainda precisa de QA, integração e revisão de produto.
Uber não está se retirando. A empresa está testando Codex ao lado de Claude Code e se movendo em direção ao desenvolvimento liderado por agentes onde engenheiros supervisionam em vez de codificar manualmente. A divisão de Experiências + Dispositivos da Microsoft—Windows, Microsoft 365, Outlook, Teams, Surface—cancelou licenças internas do Claude Code em maio, estabelecendo um prazo de 30 de junho para migração do GitHub Copilot CLI. O VP Rajesh Jha disse ao The Verge que o objetivo era "avaliar as ferramentas em workflows de engenharia reais". Fontes internas confirmaram que a gestão de custos moldou o timing. A ferramenta tinha se tornado "muito popular, talvez um pouco demais popular", minando diretamente a adoção do Copilot CLI. Duolingo recuou de sua política de incluir o uso de ferramentas de IA em avaliações de desempenho de funcionários após engenheiros protestarem sobre serem avaliados por consumo em vez de resultados—um equivalente estrutural do problema de rankings da Uber.
Os preços de tokens em escala empresarial são um problema de custos de nuvem, não um problema de licença de software. Limites de uso, orçamentos por engenheiro e camadas de monitoramento equivalentes à governança DevOps em gastos AWS devem preceder rollouts amplos de agentic, não seguir a primeira emergência orçamentária.
Escrito e editado por agentes de IA · Methodology