Recomendador automático de agentes reduce pasos de ingeniería en sistemas multi-agentes a uno

Framework de investigación automatiza la creación de workflows multi-agentes (selección de agentes, planificación, grafo de ejecución). Los CIOs empresariales deberían prestar atención: el ensamblaje de aplicaciones con IA se desplaza de la ingeniería personalizada a la configuración declarativa.

Un nuevo framework de investigación de Kishan Athrey, Ramin Pishehvar, Brian Riordan y Mahesh Viswanathan automatiza la composición de sistemas multi-agentes—creación de planes, selección de agentes y ensamblaje del grafo de ejecución—colapsando tres pasos manuales de ingeniería en un único pipeline.

El framework, descrito en "From Intent to Execution: Composing Agentic Workflows with Agent Recommendation", contiene cinco módulos: un planificador derivado de LLM que descompone la intención del usuario en tareas discretas; un grafo de llamadas dinámico que modela dependencias de ejecución; un orquestador que mapea agentes a tareas; y un recomendador de agentes que obtiene candidatos de registros locales y globales. El recomendador—un sistema de recuperación de información en dos etapas que empareja un recuperador vectorial rápido con un re-ranqueador basado en LLM—presenta los agentes más adecuados para cada tarea.

Un agente crítico supervisor re-evalúa tanto recomendaciones de agentes como de herramientas contra el plan general de ejecución. Incluir esta etapa de crítica mejora el recall en la selección de agentes, enmarcando revisión e iteración como esencial, no opcional, en el ensamblaje multi-agentes de extremo a extremo.

Los benchmarks de extremo a extremo que cubren calidad de planificación, precisión de selección de agentes y finalización de tareas muestran que el framework supera enfoques anteriores en tasa de recall y demuestra mayor robustez y escalabilidad. Los experimentos de ablación a través de opciones de embedder, modelo de re-ranqueador y estrategias de enriquecimiento de descripción de agentes proporcionan a los profesionales una superficie de decisión para ajustar la pila de recuperación a sus propios registros.

Los arquitectos de IA empresarial obtienen claridad arquitectónica inmediata: si la selección de agentes y el cableado de workflow pueden automatizarse a partir de la intención en lenguaje natural, el cuello de botella en la entrega de aplicaciones con IA se desplaza de la ingeniería personalizada de grafo de agentes a la calidad del registro y la claridad de la especificación de tareas. Las organizaciones que construyen catálogos de agentes internos ahora tienen un patrón de diseño concreto de recuperación y ranking—uno que escala tanto a pools de agentes locales como globales sin lógica de enrutamiento codificada manualmente.

El desempeño en escala de registro empresarial sigue sin ser probado. Los experimentos del artículo están en alcance académico; el comportamiento contra registros de miles de agentes de producción, cada uno con descripciones de capacidad superpuestas, aún no está establecido. Los agentes mal documentados siguen siendo un modo de fallo real.

El modelo de composición basado en recuperación se mapea limpiamente sobre plataformas que ya administran catálogos de agentes. El patrón IR de dos etapas es infraestructura familiar para equipos con canalizaciones RAG existentes. La brecha entre prototipo de investigación y orquestación de grado de producción se está estrechando. Los equipos que invierten en registros de agentes estructurados ahora tendrán el camino más corto hacia la adopción cuando frameworks como este maduren.

Sources

Framework automates multi-agent system composition, replacing manual plan creation, agent selection, and execution graph assembly
"the creation of such MAS currently involves manual composition of the plan, manual selection of appropriate agents, and manual creation of execution graphs. This paper introduces a framework for the automated creation of multi-agent systems which replaces multiple manual steps with an automated framework."
arxiv.org ↗
Agent recommender uses a two-stage IR system comprising a fast retriever and an LLM-based re-ranker
"The agent recommender uses a two-stage information retrieval (IR) system comprising a fast retriever and an LLM-based re-ranker."
arxiv.org ↗
Framework sources agent candidates from both local and global agent registries
"an agent recommender that finds the most suitable agent(s) from local and global agent registries."
arxiv.org ↗
Critique agent holistically re-evaluates agent and tool recommendations against the overall plan and further improves recall score
"The critique agent holistically reevaluates both agent and tool recommendations against the overall plan. We show that the inclusion of the critique agent further enhances the recall score, proving that the comprehensive review and revision of task-based agent selection is an essential step in building end-to-end multi-agent systems."
arxiv.org ↗
Framework outperforms state-of-the-art in recall rate and is more robust and scalable than previous approaches
"Our experimental results show that our approach outperforms the state-of-the-art in terms of the recall rate and is more robust and scalable compared to previous approaches."
arxiv.org ↗
Experiments explored embedder choice, re-ranker model, agent description enrichment, and the critique agent
"We implemented a series of experiments exploring the choice of embedders, re-rankers, agent description enrichment, and supervising critique agent."
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

Recomendador automático de agentes reduce pasos de ingeniería en sistemas multi-agentes a uno

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.