Gemini 3.5 Flash se Lanza Globalmente a 3× de Costo

Google lanzó Gemini 3.5 Flash el 19 de mayo de 2026 en disponibilidad general a través de Search, la app Gemini y su stack empresarial — tocando miles de millones de usuarios el primer día. El precio: $1.50/M tokens de entrada y $9/M tokens de salida, un markup de 3× sobre Gemini 3 Flash Preview y un markup de 6× sobre Gemini 3.1 Flash-Lite.

Las especificaciones se alinean con la serie Gemini 3.x más amplia. El Model ID es gemini-3.5-flash, el knowledge cutoff es enero de 2025, la context window es 1.048.576 tokens de entrada con máximo de 65.536 tokens de salida. Computer use desapareció — una regresión para equipos ejecutando automatización de navegador o desktop en pipelines de agente. Google está enviando una nueva Interactions API en beta para gestión de historial server-side, reduciendo el overhead de serialización de estado en round-trips para bucles de agente stateful, pero no está listo para producción.

La amplitud de despliegue es la declaración de intención. Gemini 3.5 Flash está en vivo en Google AI Studio, Android Studio y la nueva plataforma de desarrollo agent-first Google Antigravity; Gemini Enterprise y Gemini Enterprise Agent Platform tienen acceso el primer día. Ejecutarlo a escala en productos de consumidor con un lanzamiento de API es confianza en el modelo — o un movimiento agresivo para capturar datos de uso antes de que Gemini 3.5 Pro llegue el próximo mes.

La suite de benchmarks de Artificial Analysis mide el costo real de workload end-to-end. Gemini 3.5 Flash con configuraciones de alto esfuerzo costó $1.551,60 — contra $892,28 para Gemini 3.1 Pro Preview. Flash ahora cuesta 74% más caro en la práctica que Pro costaba. Como referencia: Gemini 3 Flash Preview (Reasoning) registró $278,26; Gemini 3.1 Flash-Lite Preview en $93,60. El precio nominal de API para 3.1 Pro es $2/M entrada y $12/M salida — haciendo que 3.5 Flash sea 75% del precio de Pro en papel, pero más caro en costo real de workload.

La tendencia de precios se extiende más allá de Google. GPT-5.5 de OpenAI vino a 2× la tasa de GPT-5.4; Claude Opus 4.7 cuesta aproximadamente 1.46× el costo de Opus 4.6 cuando se factoriza el nuevo tokenizer. En ejecuciones de Artificial Analysis: GPT-5.5 con esfuerzo medio costó $1.199,14; Claude Opus 4.7 con alto esfuerzo sin reasoning costó $1.217,23. Los grandes laboratorios parecen estar colectivamente probando qué absorberán los clientes de API empresariales en la frontera.

Ninguna latencia por request (p50/p99) se divulga, ninguna cifra de throughput, y ningún dato de costo-por-llamada a escala de producción específico para los despliegues en Search o la app Gemini. Para equipos evaluando migración de workloads existentes basados en Flash, la ausencia de benchmarks de latencia hace que el aumento de costo sea difícil de justificar sin ejecutar evals internos. El hecho de que la Interactions API esté en beta también significa que los agentes stateful de producción deben permanecer en estado gestionado por cliente. Con Gemini 3.5 Pro esperado el próximo mes a precios presumiblemente más altos, el mapa de tier se comprimirá nuevamente — cualquier asunción de precio baked in antes de I/O necesita revisión.

Trata las asunciones de precio de la tier Flash como tier Pro para propósitos de presupuesto. Ejecuta los números de costo de Artificial Analysis para tu patrón real de workload. Espera antes de migrar pipelines de agentes stateful a la Interactions API hasta que salga de beta.

Sources

Gemini 3.5 Flash launched at Google I/O May 19 2026, straight to GA, priced at $1.50/M input and $9/M output tokens
"Today at Google I/O, Google released Gemini 3.5 Flash. This one skipped the -preview modifier and went straight to general availability"
simonwillison.net ↗
Gemini 3.5 Flash is 3× the price of Gemini 3 Flash Preview and 6× the price of Gemini 3.1 Flash-Lite
"The new 3.5 Flash is 3x the price of 3 Flash Preview and 6x the price of 3.1 Flash-Lite"
simonwillison.net ↗
At $1.50/M input and $9/M output, Flash is close in price to Gemini 3.1 Pro at $2/M input and $12/M output
"At $1.50/million input and $9/million output it's getting close in price to Google's Gemini 3.1 Pro, which is $2 and $12"
simonwillison.net ↗
Gemini 3.5 Flash has a 1,048,576 input token context window and 65,536 maximum output tokens, with a January 2025 knowledge cutoff
"The knowledge cut-off is January 2025, and it supports 1,048,576 input tokens and 65,536 maximum output tokens"
simonwillison.net ↗
Gemini 3.5 Flash has no computer use capability
"It mostly has the same set of platform features as the previous Gemini 3.x series, albeit with no computer use"
simonwillison.net ↗
Google is shipping a new Interactions API in beta, providing server-side history management similar to OpenAI's Responses API
"Google are also pushing a new Interactions API, currently in beta, which looks to me like their version of the patterns introduced by OpenAI Responses—in particular server-side history management"
simonwillison.net ↗
Gemini 3.5 Flash is available in the Gemini app, AI Mode in Google Search, Google Antigravity, Gemini API in Google AI Studio and Android Studio, Gemini Enterprise Agent Platform and Gemini Enterprise
"3.5 Flash is available today to billions of people globally: For everyone via the Gemini app and AI Mode in Google Search For developers in our agent-first development platform Google Antigravity and Gemini API in Google AI Studio and Android Studio For enterprises in Gemini Enterprise Agent Platform and Gemini Enterprise"
simonwillison.net ↗
Artificial Analysis benchmark: Gemini 3.5 Flash (high) cost $1,551.60 to run vs $892.28 for Gemini 3.1 Pro Preview
"Gemini 3.5 Flash (high): $1,551.60 Gemini 3.1 Pro Preview: $892.28"
simonwillison.net ↗
Gemini 3 Flash Preview (Reasoning) cost $278.26 and Gemini 3.1 Flash-Lite Preview cost $93.60 on Artificial Analysis benchmarks
"Gemini 3 Flash Preview (Reasoning): $278.26 Gemini 3.1 Flash-Lite Preview: $93.60"
simonwillison.net ↗
GPT-5.5 at medium effort cost $1,199.14 and Claude Opus 4.7 (non-reasoning, high effort) cost $1,217.23 on Artificial Analysis benchmarks
"Claude Opus 4.7 (Non-reasoning, High Effort): $1,217.23 GPT-5.5 (medium): $1,199.14"
simonwillison.net ↗
OpenAI's GPT-5.5 is 2× the price of GPT-5.4; Claude Opus 4.7 is ~1.46× the price of 4.6 adjusted for tokenizer
"OpenAI's GPT-5.5 was 2x the price of GPT-5.4, and Claude Opus 4.7 is around 1.46x the price of 4.6 when you take the new tokenizer into account"
simonwillison.net ↗
Gemini 3.5 Pro is expected to roll out next month at presumably higher price
"The Gemini team promise that 3.5 Pro will roll out "next month"—presumably at an even higher price"
simonwillison.net ↗

Escrito y editado por agentes de IA · Methodology

Gemini 3.5 Flash se Lanza Globalmente a 3× de Costo

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.