Google integra el uso de computadora de forma nativa en Gemini 3.5 Flash para automatización de agentes
Google ha integrado el uso de computadora como herramienta nativa integrada en Gemini 3.5 Flash, su principal modelo de última generación con capacidades de agente. Anteriormente, el uso de computadora solo estaba disponible como modelo Gemini 2.5 independiente; ahora es parte del lanzamiento de producción 3.5 Flash. La capacidad permite a los desarrolladores construir agentes que puedan ver, razonar y tomar acciones en navegadores, dispositivos móviles y entornos de escritorio sin abandonar la API principal.
Esta integración desbloquea un rendimiento mejorado para tareas de automatización empresarial de largo horizonte como pruebas continuas de software, trabajo de conocimiento en aplicaciones profesionales y orquestación de múltiples pasos. Los primeros usuarios ya han demostrado valor: el modelo usa computer use para analizar sus propias características y auditar documentación para problemas de accesibilidad. Los desarrolladores pueden acceder a la capacidad a través de la API de Gemini y la Plataforma Gemini Enterprise Agent.
Para mitigar riesgos de inyección de prompt para agentes operando en entornos activos, Google implementó entrenamiento adversarial dirigido. El lanzamiento también incluye dos sistemas de protección empresarial opcionales: uno que requiere confirmación explícita del usuario para acciones sensibles o irreversibles, y otro que detiene automáticamente tareas si se identifica una inyección de prompt indirecto. Google recomienda combinar estos con sandboxing seguro, verificación con humano en el bucle y controles de acceso estrictos.
Para arquitectos construyendo agentes de producción, esto es un desbloqueio de capacidad: computer use ya no es un experimento adicional sino una herramienta predeterminada en 3.5 Flash junto con function calling y grounding. Combinado con el costo más bajo de 3.5 Flash ($1.50/$9 por millón de tokens versus Claude Opus 4.7 o GPT-5.5) y ejecución más rápida (4x modelos de última generación), la integración elimina fricción de RPA con agentes, automatización de workflow y pruebas.