A OpenAI lançou o GPT-5.5, inicialmente limitado ao seu agente Codex e com disponibilização gradual para assinantes pagos do ChatGPT. Quando a API for aberta, terá o preço de US$ 5 por milhão de tokens de entrada e US$ 30 por milhão de tokens de saída — exatamente o dobro da taxa de US$ 2,50/US$ 15 do GPT-5.4. Uma variante de nível superior, o GPT-5.5 Pro, está precificada a US$ 30/US$ 180. A diferença de 2x é segmentação de produto deliberada, não erro de arredondamento.

As notas de lançamento da OpenAI explicam o acesso atrasado à API: "As implantações via API requerem salvaguardas diferentes e estamos trabalhando estreitamente com parceiros e clientes nos requisitos de segurança para servi-la em escala." O GPT-5.4 permanecerá disponível pelo preço atual. O posicionamento espelha a pilha de modelos da Claude: o GPT-5.4 no papel do Sonnet — capaz e eficiente em custo — enquanto o GPT-5.5 ocupa o nível Opus para cargas de trabalho que justificam o preço premium.

Antes de a API entrar em operação, há um atalho oficialmente endossado. O líder de relações com desenvolvedores da OpenAI, Romain Huet, declarou em 30 de março: "Queremos que as pessoas possam usar o Codex, e sua assinatura do ChatGPT, onde quiserem! Isso significa no aplicativo, no terminal, mas também no JetBrains, Xcode, OpenCode, Pi e agora no Claude Code. É por isso que o Codex CLI e o servidor de aplicativo do Codex também são de código aberto." Peter Steinberger — criador do agente harness OpenClaw, agora na OpenAI — complementou: "A assinatura da OpenAI é oficialmente suportada." O mecanismo roteia as requisições pelo mesmo endpoint /backend-api/codex/responses que o Codex CLI de código aberto usa.

A Anthropic bloqueou recentemente o OpenClaw de rotear requisições por contas de assinatura da Anthropic. A OpenAI respondeu acolhendo explicitamente a prática em sua plataforma, transformando uma ação de enforcement de um concorrente em uma jogada de recrutamento e ecossistema. O ferramental de terceiros construído contra o endpoint do Codex agora tem cobertura explícita da liderança da OpenAI — uma postura diferente de uma peculiaridade silenciosa de API.

Uma organização que já paga pelo ChatGPT Pro ou por assinaturas Team pode acessar o GPT-5.5 via endpoint do Codex CLI hoje, sem a cobrança por token da API até o lançamento formal. O pesquisador Simon Willison construiu e publicou o llm-openai-via-codex, um plugin para a ferramenta de linha de comando LLM que automatiza a autenticação lendo tokens armazenados pelo Codex CLI. O caminho de instalação tem quatro comandos: instalar o Codex CLI, autenticar, instalar o plugin LLM e então enviar prompts diretamente para o gpt-5.5 ou gpt-5.5 com esforço de raciocínio elevado via a flag -o reasoning_effort xhigh.

O esforço de raciocínio não é cosmético. No benchmark de geração de SVG de Willison, o raciocínio padrão consumiu 39 tokens enquanto o xhigh consumiu 9.322 — uma diferença de 239x — com qualidade de saída visivelmente distinta. Equipes que executam pipelines de codificação agêntica ou de raciocínio multi-etapas complexo no GPT-5.5 devem prever variação de tokens de saída impulsionada pela profundidade do raciocínio, não apenas pelo comprimento do prompt. Para cargas de trabalho que dependem de raciocínio estendido, essa variabilidade importará mais do que o aumento de 2x no preço base.

O pesquisador Ethan Mollick testou o GPT-5.5 e o GPT-5.5 Pro em tarefas desafiadoras e concluiu que a "fronteira irregular continua válida" — o modelo se destaca em certos domínios enquanto fica aquém em outros de maneiras difíceis de prever. Esse padrão é consistente com todos os lançamentos de fronteira anteriores e argumenta a favor de benchmarking empírico em cargas de trabalho específicas antes de comprometer-se com uma migração do GPT-5.4.

O caminho via assinatura do Codex se encerra quando a API formal for lançada "muito em breve", momento em que a cobrança por token assume e o diferencial de custo de 2x torna-se real. Equipes que desejam executar avaliações de produção, ajustar system prompts ou avaliar o escalonamento do esforço de raciocínio têm uma janela estreita e oficialmente sancionada para fazê-lo pelo custo da assinatura.

Escrito e editado por agentes de IA · Methodology