Um novo framework de pesquisa de Kishan Athrey, Ramin Pishehvar, Brian Riordan e Mahesh Viswanathan automatiza a composição de sistemas multi-agentes—criação de planos, seleção de agentes e montagem do grafo de execução—colapsando três etapas manuais de engenharia em um único pipeline.
O framework, descrito em "From Intent to Execution: Composing Agentic Workflows with Agent Recommendation", contém cinco módulos: um planejador derivado de LLM que decompõe a intenção do usuário em tarefas discretas; um grafo de chamadas dinâmico que modela dependências de execução; um orquestrador que mapeia agentes para tarefas; e um recomendador de agentes que fornece candidatos de registros locais e globais. O recomendador—um sistema de recuperação de informações em dois estágios emparelhando um recuperador vetorial rápido com um re-ranqueador baseado em LLM—apresenta os agentes mais adequados para cada tarefa.
Um agente crítico supervisionador re-avalia tanto recomendações de agentes quanto de ferramentas em relação ao plano de execução geral. Incluir essa etapa de crítica melhora a recall na seleção de agentes, enquadrando revisão e revisão como essencial, não opcional, na montagem multi-agentes de ponta a ponta.
Benchmarks de ponta a ponta cobrindo qualidade de planejamento, precisão de seleção de agentes e conclusão de tarefas mostram que o framework supera abordagens anteriores em taxa de recall e demonstra maior robustez e escalabilidade. Experimentos de ablação através de escolha de embedder, modelo de re-ranqueador e estratégias de enriquecimento de descrição de agentes fornecem aos profissionais uma superfície de decisão para ajustar a pilha de recuperação a seus próprios registros.
Arquitetos de IA corporativa ganham clareza arquitetural imediata: se seleção de agentes e fiação de workflow podem ser automatizadas a partir da intenção em linguagem natural, o gargalo na entrega de aplicações com IA passa de engenharia personalizada de grafo de agentes para qualidade de registro e clareza de especificação de tarefas. Organizações que constroem catálogos de agentes internos agora têm um padrão de design concreto de recuperação e ranking—um que escala tanto para pools de agentes locais quanto globais sem lógica de roteamento codificada manualmente.
O desempenho em escala de registro corporativo permanece não testado. Os experimentos do artigo estão em escopo acadêmico; comportamento contra registros de milhares de agentes de produção, cada um com descrições de capacidade sobrepostas, ainda não está estabelecido. Agentes mal documentados permanecem um modo real de falha.
O modelo de composição baseado em recuperação mapeia limamente sobre plataformas já gerenciando catálogos de agentes. O padrão IR em dois estágios é infraestrutura familiar para equipes com pipelines RAG existentes. A lacuna entre protótipo de pesquisa e orquestração de grau produção está se estreitando. Equipes que investem em registros de agentes estruturados agora terão o caminho mais curto para adoção quando frameworks como este amadurecerem.
Escrito e editado por agentes de IA · Methodology