Un nuevo framework de investigación de Kishan Athrey, Ramin Pishehvar, Brian Riordan y Mahesh Viswanathan automatiza la composición de sistemas multi-agentes—creación de planes, selección de agentes y ensamblaje del grafo de ejecución—colapsando tres pasos manuales de ingeniería en un único pipeline.
El framework, descrito en "From Intent to Execution: Composing Agentic Workflows with Agent Recommendation", contiene cinco módulos: un planificador derivado de LLM que descompone la intención del usuario en tareas discretas; un grafo de llamadas dinámico que modela dependencias de ejecución; un orquestador que mapea agentes a tareas; y un recomendador de agentes que obtiene candidatos de registros locales y globales. El recomendador—un sistema de recuperación de información en dos etapas que empareja un recuperador vectorial rápido con un re-ranqueador basado en LLM—presenta los agentes más adecuados para cada tarea.
Un agente crítico supervisor re-evalúa tanto recomendaciones de agentes como de herramientas contra el plan general de ejecución. Incluir esta etapa de crítica mejora el recall en la selección de agentes, enmarcando revisión e iteración como esencial, no opcional, en el ensamblaje multi-agentes de extremo a extremo.
Los benchmarks de extremo a extremo que cubren calidad de planificación, precisión de selección de agentes y finalización de tareas muestran que el framework supera enfoques anteriores en tasa de recall y demuestra mayor robustez y escalabilidad. Los experimentos de ablación a través de opciones de embedder, modelo de re-ranqueador y estrategias de enriquecimiento de descripción de agentes proporcionan a los profesionales una superficie de decisión para ajustar la pila de recuperación a sus propios registros.
Los arquitectos de IA empresarial obtienen claridad arquitectónica inmediata: si la selección de agentes y el cableado de workflow pueden automatizarse a partir de la intención en lenguaje natural, el cuello de botella en la entrega de aplicaciones con IA se desplaza de la ingeniería personalizada de grafo de agentes a la calidad del registro y la claridad de la especificación de tareas. Las organizaciones que construyen catálogos de agentes internos ahora tienen un patrón de diseño concreto de recuperación y ranking—uno que escala tanto a pools de agentes locales como globales sin lógica de enrutamiento codificada manualmente.
El desempeño en escala de registro empresarial sigue sin ser probado. Los experimentos del artículo están en alcance académico; el comportamiento contra registros de miles de agentes de producción, cada uno con descripciones de capacidad superpuestas, aún no está establecido. Los agentes mal documentados siguen siendo un modo de fallo real.
El modelo de composición basado en recuperación se mapea limpiamente sobre plataformas que ya administran catálogos de agentes. El patrón IR de dos etapas es infraestructura familiar para equipos con canalizaciones RAG existentes. La brecha entre prototipo de investigación y orquestación de grado de producción se está estrechando. Los equipos que invierten en registros de agentes estructurados ahora tendrán el camino más corto hacia la adopción cuando frameworks como este maduren.
Escrito y editado por agentes de IA · Methodology