A Anthropic lançou o Claude Opus 4.7 em 16 de abril de 2026, com uma janela de contexto de 1M tokens a preços padrão de API: $5 por milhão de tokens de entrada, $25 por milhão de tokens de saída. Os times agora podem manter 100k+ bases de código mais notas de projetos multi-sessão em um único prompt sem atingir um custo adicional.
O modelo obteve 0.715 no benchmark interno de agente de pesquisa da Anthropic, empatado em primeiro entre seis módulos. No módulo General Finance—o maior—Opus 4.7 obteve 0.813 versus 0.767 para Opus 4.6. O ganho de 46 pontos é importante para agentes de revisão de código que rastreiam longas sequências de chamadas de ferramentas sem perder contexto.
O seguimento de instruções melhorou significativamente. A Anthropic relata: "Onde modelos anteriores interpretavam instruções vagamente ou pulavam partes inteiras, Opus 4.7 segue as instruções literalmente." Para times de engenharia, isso significa menos loops de retry e menos engenharia defensiva de prompts. Prompts escritos para Opus 4.6 podem produzir saídas diferentes—migração requer validação.
A resolução da visão aumentou de 1.15MP para 3.75MP (2576 pixels na borda mais longa). Análise de screenshots, interpretação de gráficos e OCR de diagramas todos melhoraram. Isso é importante para agentes que leem logs de build em screenshots do Slack ou extraem dados de diagramas arquitetônicos enviados.
Os controles em tempo de execução têm mais peso. Orçamentos de tarefa limitam gasto total de tokens para um loop de agente. Níveis de esforço trocam capacidade por velocidade: esforço baixo aproxima esforço médio em Opus 4.6, permitindo redução de custo sem downgrade de modelo. Os orçamentos de pensamento estendido foram removidos—uma mudança comportamental que quebra compatibilidade.
A expansão de contagem de tokens do novo tokenizador pode compensar ganhos do aumento de contexto. Monitore amplificação de token de saída por carga de trabalho. Taxas de cache-hit e topologia de cache—padrões prefix, sliding window, RAG-híbridos—se tornam drivers críticos de custo ao manter contexto de 1M entre dezenas de turnos de agente.
O limite máximo de saída de 128k é suficiente para a maioria dos fluxos de geração e análise de código, mas apertado para síntese de documentos em escala. A API de Batch Processing permanece disponível para trabalho insensível a throughput.
Para agentes de revisão de código, contexto de 1M mais seguimento mais forte de instruções permitem análise de diff end-to-end, revisão de refatoração multi-arquivo e verificações de consistência em escala de projeto sem orquestração de checkpoint-and-resume. A restrição é gerenciamento de cache e previsibilidade de custos—quantifique taxas de cache-hit e variância de token de saída antes de escalar em produção.