Breaking quarta-feira, 24 de junho de 2026 às 17:05

Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search

Google integrou computer use como uma capacidade nativa no Gemini 3.5 Flash, permitindo que o modelo veja, raciocine e tome ações em ambientes de navegador, móvel e desktop nativamente sem chamadas de API separadas. Computer use estava previamente disponível apenas como um modelo Gemini 2.5 independente mas agora é construído no tier Flash principal. Desenvolvedores podem agora usar 3.5 Flash via Gemini API e Gemini Enterprise Agent Platform para construir de forma confiável agentes customizados capazes de tarefas de automação empresarial e longo horizonte como teste contínuo de software, trabalho de conhecimento e automação de processos entre aplicações.

A integração é significativa porque Flash (contexto de 1M token, $1.50/$9 por milhão de tokens de entrada/saída) agora substitui a tier Pro mais cara para cargas de trabalho de agente. Gemini 3.5 Flash já supera Gemini 3.1 Pro em benchmarks agentic (MCP Atlas 83.6%, GDPval-AA 1656 Elo) com 4x a velocidade de saída. Adicionar computer use nativo ao Flash significa que desenvolvedores podem construir agentes cientes de tela com menor custo e maior velocidade do que competidores. Google aplicou treinamento adversarial focado para mitigar riscos de injeção de prompt e está lançando sistemas opcionais de salvaguarda empresarial: confirmação explícita do usuário para ações sensíveis e parada automática de tarefas em injeção de prompt indireto detectada.

Para equipes construão de agentes: Este é o momento de reavaliar sua stack de agente. Flash agora agrupa function calling, retrieval, busca grounding e computer use em um modelo a um preço 40% mais barato em saída do que antes. A integração nativa também significa nenhum salto de rede separado para interação de tela—menor latência para automação de navegador, RPA e fluxos de teste. Observe competidores (Claude, OpenAI) responderem em capacidade de computer use e preços.

Fontes

Primary source
blog.google
“Computer use is now a built-in tool supported in Gemini 3.5 Flash, delivering our best performance yet for agentic computer use tasks. Previously only available as a standalone Gemini 2.5 computer use model, computer use is now integrated natively in the main Gemini Flash model.”
blog.google
“With built-in computer use capability, developers can now use 3.5 Flash to reliably build custom agents that can see, reason and take action across browser, mobile and desktop environments. This unlocks improved performance for long-horizon and enterprise automation tasks like continuous software testing and knowledge work across professional applications.”
wavespeed.ai
“Gemini 3.5 Flash went GA at I/O 2026 with thinking-on-by-default, $1.50/$9 per 1M tokens, and a benchmark profile that beats Claude Opus 4.7 and GPT-5.5 on MCP Atlas and most agent suites.”

Gemini 3.5 Flash adiciona computer use nativo; framework de agente agora padrão em Search

Fontes

Receba o sinal antes do ruído.