Google integra uso de computador nativamente no Gemini 3.5 Flash para automação com agentes
Google integrou o uso de computador como uma ferramenta nativa integrada no Gemini 3.5 Flash, seu modelo principal agentic de última geração. Anteriormente, o uso de computador estava disponível apenas como um modelo Gemini 2.5 autônomo; agora faz parte da versão de produção 3.5 Flash. A capacidade permite que os desenvolvedores construam agentes que possam ver, raciocinar e tomar ação em navegadores, celulares e ambientes de desktop sem deixar a API principal.
Essa integração desbloqueia desempenho aprimorado para tarefas de automação empresarial de longo horizonte, como testes contínuos de software, trabalho de conhecimento em aplicações profissionais e orquestração multi-etapas. Os primeiros adotantes já demonstraram valor: o modelo usa computador use para analisar seus próprios recursos e auditar documentação para problemas de acessibilidade. Os desenvolvedores podem acessar a capacidade através da API Gemini e da Plataforma Gemini Enterprise Agent.
Para mitigar riscos de injeção de prompt para agentes operando em ambientes ativos, Google implementou treinamento adversarial direcionado. O lançamento também inclui dois sistemas de proteção empresarial opcionais: um que requer confirmação explícita do usuário para ações sensíveis ou irreversíveis, e outro que para automaticamente tarefas se uma injeção de prompt indireto for detectado. Google recomenda combinar esses com sandboxing seguro, verificação com humano no loop e controles de acesso rigorosos.
Para arquitetos construindo agentes de produção, essa é uma desbloqueio de capacidade: computer use não é mais um experimento adicional, mas uma ferramenta padrão no 3.5 Flash ao lado de function calling e grounding. Combinado com o custo menor do 3.5 Flash ($1.50/$9 por milhão de tokens versus Claude Opus 4.7 ou GPT-5.5) e execução mais rápida (4x modelos de última geração), a integração remove fricção de RPA agentic, automação de workflow e testes.