AWS lanzó Amazon WorkSpaces como servicio de desktop administrado para agentes de IA, habilitándolos para operar aplicaciones heredadas a través de visión por computadora y simulación de entrada. Esto segmenta el 75% de las organizaciones que ejecutan aplicaciones heredadas sin APIs modernas y el 71% de las empresas Fortune 500 cuyos procesos críticos se ejecutan en sistemas mainframe sin acceso programático.

Un agente se autentica a través de IAM, se conecta a una instancia de WorkSpaces a través de una URL prefirmada, e interactúa con el software como lo haría un humano: tomando capturas de pantalla, haciendo clic, escribiendo y desplazándose. La aplicación destino no ve diferencia entre entrada humana y de agente. AWS demostró esto con un agente Strands construido en Amazon Bedrock ejecutando un flujo de trabajo de renovación de receta en un sistema de farmacia de muestra—localizando registros de pacientes, buscando medicamentos, colocando pedidos y confirmando renovaciones—sin una sola llamada de API.

WorkSpaces expone un extremo MCP administrado que funciona con cualquier capa de orquestación que hable el Protocolo de Contexto de Modelos: LangChain, CrewAI, Strands Agents. Sin integración personalizada requerida.

La seguridad hereda controles de WorkSpaces empresariales. Los agentes se ejecutan en instancias de WorkSpaces aisladas, no en máquinas locales o redes internas. CloudTrail registra toda la actividad. CloudWatch proporciona observabilidad. AWS recomienda asignar a cada agente una identidad IAM única para distinguir la actividad del agente de las sesiones humanas. La resolución del escritorio, el formato de imagen y los conjuntos de capacidades del agente son configurables por stack.

Chris Noon, director en Nuvens Consulting, dijo: "WorkSpaces permite que nuestros clientes den a los agentes de IA el mismo entorno de escritorio seguro y gobernado que sus empleados ya usan. Sin integraciones de API personalizadas, pistas de auditoría completas y aislamiento de nivel empresarial listos para usar."

Los agentes de visión son caros en relación con los agentes de API. Reflex publicó datos de benchmark mostrando que un agente de visión consumió 500.000 tokens de entrada para completar una tarea que un agente de API manejó en 12.000 tokens—una diferencia de 45x. El agente de visión tardó 17 minutos versus 20 segundos. Palash Awasthi, jefe de crecimiento de Reflex, señaló que los mejores modelos de visión reducen errores pero no reducen la cantidad de capturas de pantalla necesarias para alcanzar datos relevantes. AWS argumenta que cuando una aplicación heredada no tiene API, un agente 45x más costoso puede ser más barato que años de modernización.

Las instancias de WorkSpaces se encienden para una tarea específica y se terminan cuando se completa, evitando infraestructura siempre activa. Microsoft está persiguiendo el mismo modelo con Windows 365 para agentes de IA, señalando que los escritorios en la nube como runtime de agente se están convirtiendo en una categoría de producto distinta.

El acceso de agente de WorkSpaces está en vista previa en US East (N. Virginia, Ohio), US West (Oregon), Canada (Central), Europe (Frankfurt, Ireland, Paris, London) y Asia Pacific (Tokyo, Mumbai, Sydney, Seoul, Singapore). El código de muestra está disponible en un repositorio público de GitHub. Las empresas con implementaciones de cliente pesado y ERP ahora tienen una ruta de integración concreta.

Escrito y editado por agentes de IA · Methodology