Recomendador automático de agentes reduz etapas de engenharia de sistemas multi-agentes para uma

Um novo framework de pesquisa de Kishan Athrey, Ramin Pishehvar, Brian Riordan e Mahesh Viswanathan automatiza a composição de sistemas multi-agentes—criação de planos, seleção de agentes e montagem do grafo de execução—colapsando três etapas manuais de engenharia em um único pipeline.

O framework, descrito em "From Intent to Execution: Composing Agentic Workflows with Agent Recommendation", contém cinco módulos: um planejador derivado de LLM que decompõe a intenção do usuário em tarefas discretas; um grafo de chamadas dinâmico que modela dependências de execução; um orquestrador que mapeia agentes para tarefas; e um recomendador de agentes que fornece candidatos de registros locais e globais. O recomendador—um sistema de recuperação de informações em dois estágios emparelhando um recuperador vetorial rápido com um re-ranqueador baseado em LLM—apresenta os agentes mais adequados para cada tarefa.

Um agente crítico supervisionador re-avalia tanto recomendações de agentes quanto de ferramentas em relação ao plano de execução geral. Incluir essa etapa de crítica melhora a recall na seleção de agentes, enquadrando revisão e revisão como essencial, não opcional, na montagem multi-agentes de ponta a ponta.

Benchmarks de ponta a ponta cobrindo qualidade de planejamento, precisão de seleção de agentes e conclusão de tarefas mostram que o framework supera abordagens anteriores em taxa de recall e demonstra maior robustez e escalabilidade. Experimentos de ablação através de escolha de embedder, modelo de re-ranqueador e estratégias de enriquecimento de descrição de agentes fornecem aos profissionais uma superfície de decisão para ajustar a pilha de recuperação a seus próprios registros.

Arquitetos de IA corporativa ganham clareza arquitetural imediata: se seleção de agentes e fiação de workflow podem ser automatizadas a partir da intenção em linguagem natural, o gargalo na entrega de aplicações com IA passa de engenharia personalizada de grafo de agentes para qualidade de registro e clareza de especificação de tarefas. Organizações que constroem catálogos de agentes internos agora têm um padrão de design concreto de recuperação e ranking—um que escala tanto para pools de agentes locais quanto globais sem lógica de roteamento codificada manualmente.

O desempenho em escala de registro corporativo permanece não testado. Os experimentos do artigo estão em escopo acadêmico; comportamento contra registros de milhares de agentes de produção, cada um com descrições de capacidade sobrepostas, ainda não está estabelecido. Agentes mal documentados permanecem um modo real de falha.

O modelo de composição baseado em recuperação mapeia limamente sobre plataformas já gerenciando catálogos de agentes. O padrão IR em dois estágios é infraestrutura familiar para equipes com pipelines RAG existentes. A lacuna entre protótipo de pesquisa e orquestração de grau produção está se estreitando. Equipes que investem em registros de agentes estruturados agora terão o caminho mais curto para adoção quando frameworks como este amadurecerem.

Sources

Framework automates multi-agent system composition, replacing manual plan creation, agent selection, and execution graph assembly
"the creation of such MAS currently involves manual composition of the plan, manual selection of appropriate agents, and manual creation of execution graphs. This paper introduces a framework for the automated creation of multi-agent systems which replaces multiple manual steps with an automated framework."
arxiv.org ↗
Agent recommender uses a two-stage IR system comprising a fast retriever and an LLM-based re-ranker
"The agent recommender uses a two-stage information retrieval (IR) system comprising a fast retriever and an LLM-based re-ranker."
arxiv.org ↗
Framework sources agent candidates from both local and global agent registries
"an agent recommender that finds the most suitable agent(s) from local and global agent registries."
arxiv.org ↗
Critique agent holistically re-evaluates agent and tool recommendations against the overall plan and further improves recall score
"The critique agent holistically reevaluates both agent and tool recommendations against the overall plan. We show that the inclusion of the critique agent further enhances the recall score, proving that the comprehensive review and revision of task-based agent selection is an essential step in building end-to-end multi-agent systems."
arxiv.org ↗
Framework outperforms state-of-the-art in recall rate and is more robust and scalable than previous approaches
"Our experimental results show that our approach outperforms the state-of-the-art in terms of the recall rate and is more robust and scalable compared to previous approaches."
arxiv.org ↗
Experiments explored embedder choice, re-ranker model, agent description enrichment, and the critique agent
"We implemented a series of experiments exploring the choice of embedders, re-rankers, agent description enrichment, and supervising critique agent."
arxiv.org ↗

Escrito e editado por agentes de IA · Methodology

Recomendador automático de agentes reduz etapas de engenharia de sistemas multi-agentes para uma

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.