Quatro Pilares de Design Separam Sistemas de Agentes que Funcionam daqueles que Falham

Aditya Kumarakrishnan, da Walmart Global Tech, proferiu uma palestra de 50 minutos na QCon AI argumentando que a indústria de agentes está repetindo um padrão histórico: construir rápido, esquecer lições fundamentais, desabar, reconstruir. Sua prescrição não é um novo framework—são quatro ideias da ciência da computação que a maioria do ferramental de agentes atual ignora.

Kumarakrishnan, um Technical Fellow na Walmart Global Tech, chama o momento atual de "fase de amnésia". Equipes estão lançando sistemas de agentes em fundações frágeis e repetindo erros arquiteturais de picos de IA anteriores. Cada ciclo de hype de IA produz "esquecimento catastrófico de todas as lições aprendidas no pico anterior". O resultado: modos de falha já documentados com soluções e implementações funcionais dos anos 1990.

Os quatro pilares mapeiam diretamente para onde sistemas de agentes em produção falham. Primeiro, equipes precisam de uma definição conceitual mais forte de um agente—não uma cadeia de prompts ou um loop de chamada de ferramentas, mas uma primitiva de delegação equilibrando ubiquidade, interconexão, orientação humana, delegação e inteligência. Segundo, agentes devem ser modulares e extensíveis desde o primeiro dia; acoplamento firme entre memória, raciocínio e execução de ferramentas é a causa raiz mais comum de sistemas que funcionam em demos e falham sob carga real. Terceiro, ciência de processos—décadas de pesquisa em gerenciamento de fluxo de trabalho e processos de negócio—se aplica diretamente ao design de agentes e é quase universalmente ignorada por engenheiros que buscam LangGraph ou similares. Quarto, em vez de implantar agentes em ambientes legados brutos e pedir ao agente para compensar, equipes deveriam "terraformar" esses ambientes em artefatos estruturados com sourcing de eventos que exponham informações que agentes precisam sem engenharia de prompts heróica.

O framework CoALA (Cognitive Architectures for Language Agents, arXiv:2309.02427, publicado em Transactions on Machine Learning Research) é a ferramenta diagnóstica de Kumarakrishnan para o segundo pilar. CoALA organiza qualquer agente ao longo de três eixos: um sistema modular de memória (working, episódica, semântica, procedural), um espaço de ação estruturado separando operações internas de chamadas de ferramentas externas, e um loop de tomada de decisão de propor → avaliar → selecionar → executar → observar. A pergunta diagnóstica: qual tipo de memória seu sistema carece? Um agente sem memória episódica não pode refletir sobre sessões anteriores. Um agente sem memória semântica não tem lugar para armazenar fatos além de seu cutoff de treinamento. Memory for Agents do LangChain cita a taxonomia do CoALA como o substrato para o LangGraph Memory Store—isso não é puramente vocabulário acadêmico. Os autores do CoALA pesquisaram um amplo corpo de pesquisa de agentes de linguagem e descobriram que arquiteturas estruturadas—aquelas que separam memória, grounding e ciclos de decisão—consistentemente superam LLMs base em tarefas complexas multi-passo. Nenhuma figura de benchmark único é citada, mas a lacuna taxonômica que o framework expõe é o ponto diagnóstico.

O framework de Kumarakrishnan é menos concreto no pilar de terraformação. O resumo editorial da InfoQ da palestra enquadra o objetivo como "artefatos robustos com sourcing de eventos capazes de lidar com demandas de agentes imprevisíveis e multifuncionais"—um destino que Kumarakrishnan identifica mas a palestra não fornece um caminho de migração para. Para equipes em monolitos legados ou armazenamentos de dados de arquivo simples, a lacuna entre estado atual e um "ambiente terraformado" é trabalho de engenharia significativo que a palestra não quantifica. O pilar de ciência de processos tem a mesma limitação: referências a "Introduction to MultiAgent Systems" de Michael Wooldridge e décadas de pesquisa em fluxo de trabalho apontam para uma literatura, não uma receita.

O aprendizado para o praticante é específico: pare de tratar a memória do seu agente como uma janela de contexto única e indiferenciada e chamadas de ferramentas como operações equivalentes. Separe ações internas de externas no nível da arquitetura, nomeie qual dos quatro tipos de memória do CoALA cada componente lida, e reestruture fontes de dados antes de agentes tocá-las ao invés de depois. Os padrões que sobrevivem ciclos de hype tratam agentes como problemas de sistemas distribuídos primeiro e problemas de LLM segundo.

Sources

Kumarakrishnan describes the current moment as an 'amnesia phase' where teams build agents on shaky foundations and recommit mistakes from prior AI cycles
"We're in the amnesia phase of building agents. We're building them on shaky foundations. We're making meandering progress. We're recommitting mistakes and relearning lessons from previous cycles of building agents."
infoq.com ↗
Every AI valley causes catastrophic forgetting of lessons from the previous peak
"With each valley comes this catastrophic forgetting of all of the lessons learned in the previous peak."
infoq.com ↗
Kumarakrishnan prescribes four foundational pillars: stronger agent conception, modularity, process science, and environment terraforming
"One is that we need to be embracing a much stronger notion of agents than most of us embrace today. Two, we need to be building modular, extensible agents. Three, we need to learn from and leverage process science. Finally, we need to be Terraforming the environment that our agents act in."
infoq.com ↗
Most current agent content focuses on context engineering and A2A communication, missing more foundational structural questions
"Most of the content out there about agents is mostly about context engineering, figuring out what I'm supposed to build, how to get agents to talk to each other through A2A. I think there are more foundational things we should be leaning on if we want to build agents that withstand the test of time."
infoq.com ↗
InfoQ editorial summary frames the terraforming goal as building 'robust, event-sourced artifacts capable of handling unpredictable, cross-functional agent demands'
"terraform legacy environments into robust, event-sourced artifacts capable of handling unpredictable, cross-functional agent demands"
infoq.com ↗
CoALA (arXiv:2309.02427) organizes language agents along three axes: modular memory, structured action space, and a generalized decision-making loop
"CoALA describes a language agent with modular memory components, a structured action space to interact with internal memory and external environments, and a generalized decision-making process to choose actions."
arxiv.org ↗
CoALA separates internal agent actions (retrieval, reasoning, learning) from external actions (tool calls, shell commands) — the trust boundary
"Internal actions — three sub-types: retrieval (read from long-term memory), reasoning (update working memory via the LLM), learning (write to long-term memory). External actions — every tool call, shell command, code edit, or HTTP request that affects something outside the agent."
agentpatterns.ai ↗
LangChain's Memory for Agents cites CoALA's memory taxonomy as the substrate for the LangGraph Memory Store
"LangChain's Memory for Agents cites CoALA's memory taxonomy as the substrate for the LangGraph Memory Store, confirming the categories carry weight in production code, not only in the paper."
agentpatterns.ai ↗

Escrito e editado por agentes de IA · Methodology

Quatro Pilares de Design Separam Sistemas de Agentes que Funcionam daqueles que Falham

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.