Anthropic lanzó Claude Opus 4.7 el 16 de abril de 2026, con una ventana de contexto de 1M tokens a precios estándar de API: $5 por millón de tokens de entrada, $25 por millón de tokens de salida. Los equipos ahora pueden mantener 100k+ bases de código más notas de proyectos multi-sesión en un único prompt sin alcanzar un acantilado de costos.
El modelo obtuvo 0.715 en el benchmark interno de agente de investigación de Anthropic, empatado en el primer lugar entre seis módulos. En el módulo General Finance—el más grande—Opus 4.7 obtuvo 0.813 versus 0.767 para Opus 4.6. La ganancia de 46 puntos es importante para agentes de revisión de código que rastrean largas secuencias de llamadas de herramientas sin perder contexto.
El seguimiento de instrucciones mejoró notablemente. Anthropic informa: "Donde modelos anteriores interpretaban instrucciones vagamente o saltaban partes enteras, Opus 4.7 sigue las instrucciones literalmente." Para equipos de ingeniería, eso significa menos bucles de reintento y menos ingeniería defensiva de prompts. Los prompts escritos para Opus 4.6 pueden producir salidas diferentes—la migración requiere validación.
La resolución de visión saltó de 1.15MP a 3.75MP (2576 píxeles en el lado más largo). El análisis de capturas de pantalla, la interpretación de gráficos y el OCR de diagramas mejoraron. Esto es importante para agentes que leen registros de compilación en capturas de pantalla de Slack o extraen datos de diagramas arquitectónicos cargados.
Los controles en tiempo de ejecución tienen más peso. Los presupuestos de tarea limitan el gasto total de tokens para un bucle de agente. Los niveles de esfuerzo intercambian capacidad por velocidad: esfuerzo bajo aproxima esfuerzo medio en Opus 4.6, lo que permite reducción de costos sin degradación de modelo. Los presupuestos de pensamiento extendido fueron removidos—un cambio de comportamiento que rompe compatibilidad.
La expansión de conteo de tokens del nuevo tokenizador puede compensar las ganancias del aumento de contexto. Monitoree la amplificación de token de salida por carga de trabajo. Las tasas de acierto de caché y topología de caché—patrones de prefijo, ventana deslizante, híbridos RAG—se convierten en impulsores de costo críticos cuando se mantiene contexto de 1M en docenas de turnos de agente.
El límite máximo de salida de 128k es suficiente para la mayoría de flujos de generación y análisis de código, pero apretado para síntesis de documentos a escala. La API de Procesamiento por Lotes sigue disponible para trabajo insensible a rendimiento.
Para agentes de revisión de código, contexto de 1M más seguimiento de instrucciones más fuerte permiten análisis de diff de extremo a extremo, revisión de refactorización de múltiples archivos y verificaciones de consistencia en escala de proyecto sin orquestación de punto de control y reanudación. La restricción es la gestión de caché y previsibilidad de costos—cuantifique tasas de acierto de caché y varianza de token de salida antes de escalar en producción.