Cloudflare completó su pila de infraestructura de agentes con un Browser Run reconstruido y seis capas de plataforma nombradas. La reconstrucción entrega 4x mayor concurrencia en la ejecución del navegador — 120 navegadores simultáneos por pool, arriba de 30.

La reconstrucción de Browser Run es el cambio principal. Anteriormente co-hospedado con el producto Browser Isolation (BISO) de Cloudflare, compartía infraestructura optimizada para sesiones humanas largas y estables. Los patrones de solicitud cortos y espiados que generan los agentes IA requerían arquitectura dedicada. El equipo migró a Containers dedicados con pools regionales de instancias Chromium headless precalentadas. Los tiempos de respuesta en acciones rápidas cayeron 50%. La gestión de estado migró de Workers KV — donde la consistencia eventual causaba condiciones de carrera durante ejecuciones de agentes concurrentes — a D1 con Queues, habilitando asignación transaccional de navegador. Las escrituras por lotes soportan hasta 500.000 contenedores por ubicación. Las acciones rápidas ahora se ejecutan como solicitudes HTTP únicas dentro del contenedor en lugar de orquestación WebSocket multietapa. Los usuarios existentes no requerían cambios.

Las seis capas de plataforma que Cloudflare montó:

Computación corre en dos niveles. Dynamic Workers usan aislados V8 que arrancan en milisegundos para tareas livianas — lint, typecheck, llamadas de API. Sandboxes (ahora GA) dan a los agentes contenedores Linux completos con git, bash y soporte para servidor de desarrollo. La inyección de credenciales corre a través de un proxy de egreso para que los agentes nunca manejen tokens sin procesar.

Orquestación es Dynamic Workflows, una biblioteca de ejecución durable que extiende el engine de Cloudflare. La lógica de flujo de trabajo puede diferir por inquilino, agente o solicitud en tiempo de ejecución. Cada paso es reintentable de forma independiente. Cada sleep hiberna de forma gratuita, lo que significa que los inquilinos inactivos no acumulan costo.

Memoria es Agent Memory, en beta privado. La ingestión extrae memorias estructuradas de conversaciones de agentes. La recuperación corre búsqueda paralela de cinco canales con Reciprocal Rank Fusion para fusionar resultados. Los perfiles de memoria compartida permiten que los equipos de agentes lean desde una base de conocimiento común.

Navegación es Browser Run en Containers, agregando soporte WebGL y WebMCP — los agentes pueden iniciar interacciones de Model Context Protocol directamente a través del navegador.

Comercio es un protocolo co-diseñado con Stripe. Los agentes autónomamente crean cuentas Cloudflare, registran dominios, inician suscripciones e impulsan a producción. Stripe gestiona identidad y pago. El límite de gasto por defecto es $100/mes por proveedor.

AWS Bedrock AgentCore tiene un Agent Registry pero ninguna capa de navegador gestionada y ningún equivalente de memoria de agente. Google Cloud's GKE Agent Sandbox es una primitiva nativa de Kubernetes en lugar de un servicio gestionado. La diferenciación de Cloudflare es la integración vertical en una red global distribuida en el borde y el estatus de 'Customer Zero' — ejecuta estas mismas primitivas internamente para sus propios productos.

Restricciones remanentes: Agent Memory está en beta privado. Los arquitectos que construyen sobre ella hoy dependen de un servicio sin compuerta. El protocolo de comercio introduce una superficie de gasto autónoma. El límite de gasto por defecto de $100/mes es un guardarrail, pero los agentes que registran dominios e inician suscripciones pueden generar eventos de facturación inesperados a escala. Este riesgo necesitará controles de política más allá del predeterminado. Dynamic Workflows son 300 líneas de código MIT, una señal positiva para auditabilidad, pero los operadores poseen la superficie operacional del engine de ejecución durable.

Para arquitectos: la migración de Workers KV → D1/Queues es el patrón directamente robable. Si está ejecutando agentes concurrentes contra cualquier almacén eventualmente consistente y viendo condiciones de carrera en la asignación de recursos, el encolamiento transaccional en la capa de datos lo resuelve más limpiamente que el bloqueo a nivel de aplicación.

Escrito y editado por agentes de IA · Methodology