OpenAI lanza familia GPT-5.6 Sol con acceso controlado por el gobierno; lidera TerminalBench en 91,9%
OpenAI anunció GPT-5.6, una familia de tres modelos—Sol (flagship), Terra (balanceado) y Luna (asequible)—el 26 de junio en vista previa limitada bajo un lanzamiento novédoso controlado por el gobierno. Sol y Terra están disponibles solo para ~20 socios verificados por el gobierno de EE.UU. a través de API, con acceso más amplio de ChatGPT/API pendiente de evaluación cibernética federal formal para agosto de 2026. Esto marca la primera vez que un laboratorio de frontera estadounidense lanza un modelo bajo listas de acceso administradas por el gobierno, impulsado por la orden ejecutiva cibernética de Trump del 2 de junio.
En términos de benchmark, Sol logra un rendimiento de últiéma generación en TerminalBench 2.1 (automatización de línea de comandos): 91,9% en modo de razonamiento Ultra, 88,8% en modo Max estándar, por delante de Claude Mythos 5 de Anthropic (88,0%) y el GPT-5.5 anterior (83,4%). En ExploitBench (ciberseguridad), Sol coincide con la capacidad Mythos Preview mientras usa aproximadamente 1/3 de los tokens de salida. GeneBench v1 (biología) muestra mejora sobre GPT-5.5 con menor consumo de tokens. Terra se posiciona como capacidad a nivel GPT-5.5 a costo 2x más bajo; Luna como el tier de volumen.
El precio refleja la estrategia de tier: Sol a $5/$30 (igual a GPT-5.5); Terra a $2.50/$15; Luna a $1/$6. OpenAI también introdujo almacenamiento en caché explícito de indicaciones con una vida útil mínima de 30 minutos y descuento de lectura del 90%, desplazando costos para sistemas agénticos lejos del conteo puro de tokens hacia decisiones de enrutamiento arquitectónico.
Para constructores: OpenAI está replanteando el acceso de frontera como un *problema de enrutamiento*, no un intercambio binario de costo/capacidad. El gating del gobierno es temporal (según la caracterización de OpenAI), pero la estructura de familia de modelos—tiers independientes que pueden avanzar por separado—normaliza la segmentación granular de capacidad/costo. Observe los lanzamientos multi-tier competidores de Anthropic, DeepSeek y otros.
Fuentes
- Primary source
- openai.com
“GPT-5.6 Sol launches with our most robust safety stack to date...GPT-5.6 Sol is our most capable model yet for cybersecurity”
- venturebeat.com
“Sol scored 88.76% on TerminalBench 2.1 — ahead of both GPT-5.5's 83.4% and Claude Mythos 5's 88%”
- mlq.ai
“the company is restricting initial access to roughly 20 organizations individually approved by the US government. The launch marks the first time an American AI company has released a frontier model under a government-managed access list”
- kingy.ai
“Terra is competitive with GPT-5.5 while being 2x cheaper...Luna is the throughput play...explicit cache breakpoints, a 30-minute minimum cache lifetime, cache writes billed at 1.25x”