Breaking miércoles, 24 de junio de 2026, 17:05

Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search

Google ha integrado computer use como una capacidad nativa en Gemini 3.5 Flash, permitiendo que el modelo vea, razone y tome acciones en entornos de navegador, móvil y escritorio de forma nativa sin llamadas API separadas. Computer use estaba previamente disponible solo como un modelo Gemini 2.5 independiente pero ahora está integrado en el tier Flash principal. Los desarrolladores ahora pueden usar 3.5 Flash a través de Gemini API y Gemini Enterprise Agent Platform para construir de manera confiable agentes personalizados capaces de tareas de automatización empresarial y largo horizonte como pruebas continuas de software, trabajo de conocimiento y automatización de procesos entre aplicaciones.

La integración es significativa porque Flash (contexto de 1M token, $1.50/$9 por millón de tokens de entrada/salida) ahora reemplaza el tier Pro más caro para cargas de trabajo de agente. Gemini 3.5 Flash ya supera a Gemini 3.1 Pro en puntos de referencia agentic (MCP Atlas 83.6%, GDPval-AA 1656 Elo) con 4x la velocidad de salida. Agregar computer use nativo a Flash significa que los desarrolladores pueden crear agentes conscientes de pantalla con menor costo y mayor velocidad que los competidores. Google aplicó entrenamiento adversarial dirigido para mitigar riesgos de inyección de prompt y está lanzando sistemas opcionales de salvaguardia empresarial: confirmación explícita del usuario para acciones sensibles y detención automática de tareas en inyección de prompt indirecto detectada.

Para equipos que construyen agentes: Este es el momento para reevaluar su pila de agente. Flash ahora agrupa function calling, retrieval, busqueda grounding y computer use en un modelo a un precio 40% más barato en salida que antes. La integración nativa también significa sin un salto de red separado para interacción de pantalla—menor latencia para automatización del navegador, RPA y flujos de prueba. Observe a los competidores (Claude, OpenAI) responder en capacidad de computer use y precios.

Fuentes

Primary source
blog.google
“Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks. Previously only available as a standalone Gemini 2.5 computer use model, computer use is now integrated natively in the main Gemini Flash model.”
blog.google
“With built-in computer use capability, developers can now use 3.5 Flash to reliably build custom agents that can see, reason and take action across browser, mobile and desktop environments. This unlocks improved performance for long-horizon and enterprise automation tasks like continuous software testing and knowledge work across professional applications.”
wavespeed.ai
“Gemini 3.5 Flash went GA at I/O 2026 with thinking-on-by-default, $1.50/$9 per 1M tokens, and a benchmark profile that beats Claude Opus 4.7 and GPT-5.5 on MCP Atlas and most agent suites.”

Gemini 3.5 Flash agrega computer use nativo; framework de agente ahora predeterminado en Search

Fuentes

Recibe la señal antes del ruido.