90% do código em produção enviado pelo Claude Code é escrito por ou com o Claude Code em si. O gargalo se deslocou de implementação para algo mais difícil: decidir o que construir.
Adam Wolff, um engenheiro no time do Claude Code da Anthropic e ex-Head of Engineering na Robinhood, apresentou os detalhes na QCon San Francisco. Ele extraiu conhecimento de dezoito meses construindo e operando uma ferramenta agentic de codificação em produção enquanto usava essa ferramenta como o instrumento primário de desenvolvimento. O time realiza envios para usuários diariamente em dias úteis, executa implantações internas contínuas e mantém loops de feedback fechados com uma base de usuários — principalmente engenheiros da Anthropic — que reportam bugs dentro de horas após o lançamento.
Quando custos de geração se aproximam de zero, a restrição muda. O time não otimiza mais para velocidade de implementação. Ele otimiza para velocidade de aprendizado: enviar rápido o suficiente para descobrir requisitos reais, depois redirecioná-los antes que a complexidade acumulada torne a correção de curso cara.
Wolff enquadrou a mudança nitidamente. Implementação costumava ser o polo longo porque escrever código era caro. Times passavam tempo significativo em design up-front antes de tocar um teclado. Ferramentas agentic desabam esse custo, o que significa que o retorno de um design exaustivo encolhe. O novo alvo de otimização é velocidade de aprendizado.
O primeiro case study envolveu reconstruir a camada de entrada do Claude Code do zero — uma decisão que a sabedoria convencional chama de imprudente. O time precisava de controle em nível de keystroke para slash commands, conclusão de @-mention de arquivo e conclusão de tab. Claude gerou a implementação. As decisões difíceis eram arquiteturais.
A terceira história se destaca. O time enviou uma feature e completamente a removeu dentro de duas semanas. Unshipping rápido — anteriormente um sinal de falha catastrófica de planejamento — se torna legítimo quando o custo de construir é baixo o suficiente para que a informação adquirida ao enviar supere o custo da reversão.
Para líderes de engenharia empresarial, as implicações ficam em dois níveis. No nível de tooling, a figura de 90% do time do Claude Code é um data point de dogfooding do vendor, o que significa que a metodologia é internamente auditável de uma forma que case studies externos não são. No nível de processo, o enquadramento de Wolff desafia o case padrão para reviews de arquitetura heavyweight. Se o custo marginal de uma decisão errada cai porque você pode reconstruir mais rápido, o investimento ótimo em design up-front também cai. Times tratando ferramentas agentic como digitadores rápidos — acelerando implementação sem repensar ciclos de planejamento — estão deixando a maior parte do ganho de produtividade sobre a mesa.
A apresentação tem limitações. Claude Code é uma ferramenta de desenvolvimento baseada em terminal com uma base de usuários internos comparativamente pequena e altamente engajada. Generalização para indústrias reguladas, grandes monorepos com processos strict de change-control, ou times com distribuições heterogêneas de habilidades requer cautela. Wolff não publicou comparações quantitativas de cycle-time ou dados de defect-rate. A figura de 90% fala sobre origem de código, não qualidade de output.
Anthropic trata sua própria engenharia org como o benchmark primário para as capacidades do Claude Code. Quando as pessoas construindo o agente também são seus usuários mais exigentes, dogfooding se torna uma restrição de engenharia, não um termo de marketing. A questão para todo outro time avaliando tooling agentic é se seu processo de avaliação está em qualquer lugar próximo a tão rigoroso.
Escrito e editado por agentes de IA · Methodology