OpenAI lança família GPT-5.6 Sol com acesso controlado pelo governo; lidera TerminalBench em 91,9%
OpenAI anunciou GPT-5.6, uma família de três modelos—Sol (flagship), Terra (balanceado) e Luna (acessível)—em 26 de junho em visualização limitada sob um rollout inusitado controlado pelo governo. Sol e Terra estão disponíveis apenas para ~20 parceiros verificados pelo governo dos EUA via API, com acesso ChatGPT/API mais amplo pendente de avaliação cibernética federal formal até agosto de 2026. Esto marca a primeira vez que um laboratório americano de fronteira lança um modelo sob listas de acesso gerenciadas pelo governo, impulsionado pela ordem executiva cibernética de Trump de 2 de junho.
Em termos de benchmark, Sol alcanca estado da arte em TerminalBench 2.1 (automação de linha de comando): 91,9% em modo de raciocínio Ultra, 88,8% em modo Max padrão— à frente de Claude Mythos 5 da Anthropic (88,0%) e GPT-5.5 anterior (83,4%). Em ExploitBench (segurança cibernética), Sol corresponde à capacidade Mythos Preview enquanto usa ~1/3 dos tokens de saída. GeneBench v1 (biologia) mostra melhoria em relação a GPT-5.5 com menor consumo de token. Terra é posicionado como capacidade nível GPT-5.5 com custo 2x menor; Luna como o tier de volume.
O preço reflete a estratégia de tier: Sol em $5/$30 (igual a GPT-5.5); Terra em $2.50/$15; Luna em $1/$6. OpenAI também introduziu cache de prompt explícito com tempo de vida mínimo de 30 minutos e desconto de leitura de 90%, deslocando custos para sistemas agenticos longe da contagem pura de token em direção a decisões de roteamento arquitetônico.
Para construtores: OpenAI está reformulando acesso de fronteira como um *problema de roteamento*, não um trade binário de custo/capacidade. O controle do governo é temporário (per a formulação de OpenAI), mas a estrutura de família de modelo—tiers independentes que podem avançar separadamente—normaliza segmentação de capacidade/custo granular. Aguarde lançamentos multi-tier concorrentes de Anthropic, DeepSeek e outros.
Fontes
- Primary source
- openai.com
“GPT-5.6 Sol launches with our most robust safety stack to date...GPT-5.6 Sol is our most capable model yet for cybersecurity”
- venturebeat.com
“Sol scored 88.76% on TerminalBench 2.1 — ahead of both GPT-5.5's 83.4% and Claude Mythos 5's 88%”
- mlq.ai
“the company is restricting initial access to roughly 20 organizations individually approved by the US government. The launch marks the first time an American AI company has released a frontier model under a government-managed access list”
- kingy.ai
“Terra is competitive with GPT-5.5 while being 2x cheaper...Luna is the throughput play...explicit cache breakpoints, a 30-minute minimum cache lifetime, cache writes billed at 1.25x”