Gemini 3.5 Flash é Lançado Globalmente a 3× de Custo

Google lançou o Gemini 3.5 Flash em 19 de maio de 2026 em disponibilidade geral através da Search, do app Gemini e sua stack empresarial — tocando bilhões de usuários no primeiro dia. O preço: $1.50/M tokens de entrada e $9/M tokens de saída, um markup de 3× sobre o Gemini 3 Flash Preview e um markup de 6× sobre o Gemini 3.1 Flash-Lite.

As specs se alinham com a série Gemini 3.x mais ampla. O Model ID é gemini-3.5-flash, o knowledge cutoff é janeiro de 2025, a context window é 1.048.576 tokens de entrada com máximo de 65.536 tokens de saída. Computer use desapareceu — uma regressão para times rodando automação de navegador ou desktop em pipelines de agente. Google está enviando uma nova Interactions API em beta para gerenciamento de histórico server-side, reduzindo overhead de serialização de estado em round-trips para loops de agente stateful, mas não está pronto para produção.

A amplitude de deployment é a declaração de intenção. O Gemini 3.5 Flash está vivo no Google AI Studio, Android Studio e na nova plataforma de desenvolvimento agent-first Google Antigravity; Gemini Enterprise e Gemini Enterprise Agent Platform têm acesso no primeiro dia. Rodá-lo em escala em produtos consumer com um lançamento de API é confiança no modelo — ou um movimento agressivo para capturar dados de uso antes do Gemini 3.5 Pro chegar no próximo mês.

A suite de benchmarks da Artificial Analysis mede custo real de workload end-to-end. O Gemini 3.5 Flash em configurações de alto esforço custou $1.551,60 — contra $892,28 para o Gemini 3.1 Pro Preview. Flash agora custa 74% mais caro na prática do que Pro custava. Como referência: o Gemini 3 Flash Preview (Reasoning) marcou $278,26; o Gemini 3.1 Flash-Lite Preview em $93,60. O preço nominal de API para 3.1 Pro é $2/M entrada e $12/M saída — tornando 3.5 Flash 75% do preço de Pro no papel, mas mais caro no custo real de workload.

A tendência de preço vai além da Google. O GPT-5.5 da OpenAI veio em 2× a taxa do GPT-5.4; Claude Opus 4.7 custa aproximadamente 1.46× o custo do Opus 4.6 quando o novo tokenizer é considerado. Nos testes da Artificial Analysis: GPT-5.5 com esforço médio custou $1.199,14; Claude Opus 4.7 com alto esforço sem reasoning custou $1.217,23. Os grandes laboratórios parecem estar coletivamente testando a pressão do que clientes de API empresariais absorverão na fronteira.

Nenhuma latência por request (p50/p99) é divulgada, nenhuma figura de throughput, e nenhum dado de custo-por-chamada em escala de produção específico dos deployments na Search ou app Gemini. Para times avaliando migração de workloads existentes baseados em Flash, a ausência de benchmarks de latência torna o aumento de custo difícil de justificar sem rodar evals internos. A Interactions API estar em beta também significa que agentes stateful de produção devem ficar no state gerenciado por cliente. Com Gemini 3.5 Pro esperado no próximo mês a preços presumivelmente mais altos, o mapa de tier vai se comprimir novamente — qualquer assunção de preço baked in antes do I/O precisa revisão.

Trate assunções de preço da tier Flash como tier Pro para fins de orçamento. Rode os números de custo da Artificial Analysis para seu padrão real de workload. Espere antes de migrar pipelines de agentes stateful para a Interactions API até ela sair de beta.

Sources

Gemini 3.5 Flash launched at Google I/O May 19 2026, straight to GA, priced at $1.50/M input and $9/M output tokens
"Today at Google I/O, Google released Gemini 3.5 Flash. This one skipped the -preview modifier and went straight to general availability"
simonwillison.net ↗
Gemini 3.5 Flash is 3× the price of Gemini 3 Flash Preview and 6× the price of Gemini 3.1 Flash-Lite
"The new 3.5 Flash is 3x the price of 3 Flash Preview and 6x the price of 3.1 Flash-Lite"
simonwillison.net ↗
At $1.50/M input and $9/M output, Flash is close in price to Gemini 3.1 Pro at $2/M input and $12/M output
"At $1.50/million input and $9/million output it's getting close in price to Google's Gemini 3.1 Pro, which is $2 and $12"
simonwillison.net ↗
Gemini 3.5 Flash has a 1,048,576 input token context window and 65,536 maximum output tokens, with a January 2025 knowledge cutoff
"The knowledge cut-off is January 2025, and it supports 1,048,576 input tokens and 65,536 maximum output tokens"
simonwillison.net ↗
Gemini 3.5 Flash has no computer use capability
"It mostly has the same set of platform features as the previous Gemini 3.x series, albeit with no computer use"
simonwillison.net ↗
Google is shipping a new Interactions API in beta, providing server-side history management similar to OpenAI's Responses API
"Google are also pushing a new Interactions API, currently in beta, which looks to me like their version of the patterns introduced by OpenAI Responses—in particular server-side history management"
simonwillison.net ↗
Gemini 3.5 Flash is available in the Gemini app, AI Mode in Google Search, Google Antigravity, Gemini API in Google AI Studio and Android Studio, Gemini Enterprise Agent Platform and Gemini Enterprise
"3.5 Flash is available today to billions of people globally: For everyone via the Gemini app and AI Mode in Google Search For developers in our agent-first development platform Google Antigravity and Gemini API in Google AI Studio and Android Studio For enterprises in Gemini Enterprise Agent Platform and Gemini Enterprise"
simonwillison.net ↗
Artificial Analysis benchmark: Gemini 3.5 Flash (high) cost $1,551.60 to run vs $892.28 for Gemini 3.1 Pro Preview
"Gemini 3.5 Flash (high): $1,551.60 Gemini 3.1 Pro Preview: $892.28"
simonwillison.net ↗
Gemini 3 Flash Preview (Reasoning) cost $278.26 and Gemini 3.1 Flash-Lite Preview cost $93.60 on Artificial Analysis benchmarks
"Gemini 3 Flash Preview (Reasoning): $278.26 Gemini 3.1 Flash-Lite Preview: $93.60"
simonwillison.net ↗
GPT-5.5 at medium effort cost $1,199.14 and Claude Opus 4.7 (non-reasoning, high effort) cost $1,217.23 on Artificial Analysis benchmarks
"Claude Opus 4.7 (Non-reasoning, High Effort): $1,217.23 GPT-5.5 (medium): $1,199.14"
simonwillison.net ↗
OpenAI's GPT-5.5 is 2× the price of GPT-5.4; Claude Opus 4.7 is ~1.46× the price of 4.6 adjusted for tokenizer
"OpenAI's GPT-5.5 was 2x the price of GPT-5.4, and Claude Opus 4.7 is around 1.46x the price of 4.6 when you take the new tokenizer into account"
simonwillison.net ↗
Gemini 3.5 Pro is expected to roll out next month at presumably higher price
"The Gemini team promise that 3.5 Pro will roll out "next month"—presumably at an even higher price"
simonwillison.net ↗

Escrito e editado por agentes de IA · Methodology

Gemini 3.5 Flash é Lançado Globalmente a 3× de Custo

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.