WebMCP inició pruebas de origen público en Chrome 149 el 19 de mayo, con benchmarks de scriptwalker.app que muestran que el tiempo de finalización de tareas de agentes es 8-12 veces más rápido que la automatización basada en visión que se apoya en capturas de pantalla, scraping de DOM y clics de coordenadas simulados. La propuesta de estándar abierto para la web, co-autoria de Google y Microsoft bajo el Grupo de Comunidad de Aprendizaje Automático de la W3C, permite a los sitios exponer contratos de herramientas tipadas directamente a agentes de IA en el navegador, eliminando el bucle no determinista que se rompe con cambios en el diseño de CSS o cargas de anuncios retrasadas.

La especificación define dos superficies de integración. Una API declarativa añade atributos personalizados —toolname, tooldescription, toolautosubmit— a formularios HTML existentes, mientras que una API imperativa registra callbacks de JavaScript a través de navigator.modelContext.registerTool(), proporcionando un nombre, descripción e esquema de entrada que el agente invoca directamente dentro del contexto JS de la página. No hay una capa de red separada; el manejador se ejecuta localmente con los mismos permisos que el usuario ya tiene, y el navegador aplica un modelo de consentimiento con ámbito donde los sitios se inscriban, los usuarios otorguen acceso y las llamadas de herramientas fuera de ámbito son rechazadas. Microsoft envió soporte para Edge 147 en marzo de 2026, y Booking.com, Shopify, Instacart, Expedia, Intuit y Redfin se han comprometido con las implementaciones.

Los números operativos de Byteiota muestran que los flujos habilitados para WebMCP producen un 67% menos de errores y tasas de finalización de tareas un 45% mejores en comparación con el scraping visual, con sitios de comercio electrónico informando que la finalización de compras es 3 veces más rápida una vez que los flujos de pago exponen herramientas estructuradas en lugar de árboles DOM opacos. La adopción ya está en aproximadamente el 12% de los sitios web corporativos y el 41% en comercio electrónico, sugiriendo que el costo de anotación es lo suficientemente bajo que los equipos de producto lo están tratando como una jugada de optimización de conversión en lugar de un protocolo experimental. Chrome DevTools para Agentes 1.0 se lanzó junto con la prueba, dando a los agentes de codificación de IA acceso direto a registros de consola, tráfico de red y trazas de rendimiento a través de un servidor MCP con un panel de WebMCP dedicado, además de una nueva categoría de auditoría de Lighthouse "Navegación Agénica".

Sin embargo, la pila sigue siendo una monocultura. El único agente que actualmente consume WebMCP es Gemini en Chrome, y la especificación sigue siendo un borrador de grupo comunitario, no un estándar W3C ratificado. Los arquitectos deben mantener rutas de retroceso paralelas: el mismo agente todavía necesita lógica de captura de pantalla y DOM para páginas no anotadas, usuarios de Safari y Firefox hasta el tercer trimestre de 2026 y el cuarto trimestre de 2026 respectivamente, incluso con un polyfill disponible en docs.mcp-b.ai. Esa realidad de doble ruta significa que los equipos de infraestructura están aumentando, no retirando, sus pilas de inferencia basadas en visión.

El riesgo más difícil es el adversario. Debido a que cualquier página puede registrar herramientas, los practicantes de la seguridad señalan que sitios maliciosos pueden publicar definiciones de herramientas falsas diseñadas para manipular a los agentes en acciones no autorizadas: una superficie de ataque que sigue sin abordarse para transacciones financieras, de identidad o de alto valor. Hasta que el modelo de permisos se endurezca contra el registro de herramientas adversarias, WebMCP debe tratarse como una capa de interacción de solo lectura o de bajo riesgo, no un límite de ejecución con privilegios.

Para aquellos que envían agentes de navegador hoy, añadan anotaciones de WebMCP declarativas a sus flujos pesados de formularios —requiere minutos de trabajo por página— pero mantengan activo su stack de retroceso basado en visión y no lo conecten a flujos de pago o identidad hasta que se cierre la superficie de herramienta adversaria.

Escrito y editado por agentes de IA · Methodology