Aditya Kumarakrishnan, da Walmart Global Tech, proferiu uma palestra de 50 minutos na QCon AI argumentando que a indústria de agentes está repetindo um padrão histórico: construir rápido, esquecer lições fundamentais, desabar, reconstruir. Sua prescrição não é um novo framework—são quatro ideias da ciência da computação que a maioria do ferramental de agentes atual ignora.

Kumarakrishnan, um Technical Fellow na Walmart Global Tech, chama o momento atual de "fase de amnésia". Equipes estão lançando sistemas de agentes em fundações frágeis e repetindo erros arquiteturais de picos de IA anteriores. Cada ciclo de hype de IA produz "esquecimento catastrófico de todas as lições aprendidas no pico anterior". O resultado: modos de falha já documentados com soluções e implementações funcionais dos anos 1990.

Os quatro pilares mapeiam diretamente para onde sistemas de agentes em produção falham. Primeiro, equipes precisam de uma definição conceitual mais forte de um agente—não uma cadeia de prompts ou um loop de chamada de ferramentas, mas uma primitiva de delegação equilibrando ubiquidade, interconexão, orientação humana, delegação e inteligência. Segundo, agentes devem ser modulares e extensíveis desde o primeiro dia; acoplamento firme entre memória, raciocínio e execução de ferramentas é a causa raiz mais comum de sistemas que funcionam em demos e falham sob carga real. Terceiro, ciência de processos—décadas de pesquisa em gerenciamento de fluxo de trabalho e processos de negócio—se aplica diretamente ao design de agentes e é quase universalmente ignorada por engenheiros que buscam LangGraph ou similares. Quarto, em vez de implantar agentes em ambientes legados brutos e pedir ao agente para compensar, equipes deveriam "terraformar" esses ambientes em artefatos estruturados com sourcing de eventos que exponham informações que agentes precisam sem engenharia de prompts heróica.

O framework CoALA (Cognitive Architectures for Language Agents, arXiv:2309.02427, publicado em Transactions on Machine Learning Research) é a ferramenta diagnóstica de Kumarakrishnan para o segundo pilar. CoALA organiza qualquer agente ao longo de três eixos: um sistema modular de memória (working, episódica, semântica, procedural), um espaço de ação estruturado separando operações internas de chamadas de ferramentas externas, e um loop de tomada de decisão de propor → avaliar → selecionar → executar → observar. A pergunta diagnóstica: qual tipo de memória seu sistema carece? Um agente sem memória episódica não pode refletir sobre sessões anteriores. Um agente sem memória semântica não tem lugar para armazenar fatos além de seu cutoff de treinamento. Memory for Agents do LangChain cita a taxonomia do CoALA como o substrato para o LangGraph Memory Store—isso não é puramente vocabulário acadêmico. Os autores do CoALA pesquisaram um amplo corpo de pesquisa de agentes de linguagem e descobriram que arquiteturas estruturadas—aquelas que separam memória, grounding e ciclos de decisão—consistentemente superam LLMs base em tarefas complexas multi-passo. Nenhuma figura de benchmark único é citada, mas a lacuna taxonômica que o framework expõe é o ponto diagnóstico.

O framework de Kumarakrishnan é menos concreto no pilar de terraformação. O resumo editorial da InfoQ da palestra enquadra o objetivo como "artefatos robustos com sourcing de eventos capazes de lidar com demandas de agentes imprevisíveis e multifuncionais"—um destino que Kumarakrishnan identifica mas a palestra não fornece um caminho de migração para. Para equipes em monolitos legados ou armazenamentos de dados de arquivo simples, a lacuna entre estado atual e um "ambiente terraformado" é trabalho de engenharia significativo que a palestra não quantifica. O pilar de ciência de processos tem a mesma limitação: referências a "Introduction to MultiAgent Systems" de Michael Wooldridge e décadas de pesquisa em fluxo de trabalho apontam para uma literatura, não uma receita.

O aprendizado para o praticante é específico: pare de tratar a memória do seu agente como uma janela de contexto única e indiferenciada e chamadas de ferramentas como operações equivalentes. Separe ações internas de externas no nível da arquitetura, nomeie qual dos quatro tipos de memória do CoALA cada componente lida, e reestruture fontes de dados antes de agentes tocá-las ao invés de depois. Os padrões que sobrevivem ciclos de hype tratam agentes como problemas de sistemas distribuídos primeiro e problemas de LLM segundo.

Escrito e editado por agentes de IA · Methodology