Yohei Nakajima, cuyo bucle de tareas BabyAGI acumuló más de 20.000 estrellas en GitHub en 2023 y ayudó a definir qué significaba \"agente autónomo\" ese año, ha publicado un documento que propone una inversión estructural de cómo se construyen los runtimes de agentes. El proyecto se llama ActiveGraph (arXiv, 21 de mayo de 2026; Apache-2.0, instalable vía pip). La tesis: cada framework convencional hoy se construye alrededor del bucle de LLM con registro añadido después. ActiveGraph lo invierte — el registro de eventos de solo adición es la fuente de verdad, y el grafo de trabajo es una proyección determinista del mismo.\n\nLa mecánica es event-sourcing aplicado como sustrato primario. Cada mutación en el mundo del agente — una llamada de herramienta, una afirmación producida, un cambio de regla, una respuesta del modelo — es un evento escrito en el registro. Nada más existe como estado autorizado. El \"grafo\" que los comportamientos leen se recalcula replicando ese registro desde el principio; el documento lo llama el contrato de determinismo. Los comportamientos en sí son reactivos: un comportamiento declara a qué tipos de eventos y patrones de forma de grafo se suscribe, se dispara cuando ocurre una coincidencia, posiblemente llama a un modelo o herramienta, y emite nuevos eventos. Ningún comportamiento llama a otro directamente. La coordinación es completamente mediada por el grafo compartido.\n\nTres garantías se derivan de este diseño que los sistemas de memoria basados en recuperación aumentada o resumición no proporcionan. Primero, reproducción determinista: cualquier ejecución se reconstruye byte por byte a partir de su registro, con un caché direccionado por contenido eliminando nuevas llamadas de LLM en la reproducción. Segundo, bifurcación económica: una ejecución se bifurca en cualquier evento en una bifurcación independiente, con solo eventos divergentes después del punto de bifurcación ejecutando — sin gasto de API redundante. Tercero, linaje de extremo a extremo: la cadena causal desde el objetivo de alto nivel hasta la llamada individual del modelo es datos de primera clase, no reconstruida post-hoc a partir de registros dispersos.\n\nEl runtime se envía con 12 primitivas nombradas. La inusual es la relation-behavior: lógica adjunta a una arista tipada, no a ninguno de los objetos finales. Una arista `depends_on` entre tareas, por ejemplo, puede llevar la lógica de desbloqueo en sí misma en lugar de requerir un planificador central para vigilar la resolución de dependencias. Los fallos también son de primera clase: un fallo de comportamiento emite un evento `behavior.failed` en el registro en lugar de lanzar una excepción, haciendo que los fallos sean rastreables a través del mismo grafo causal que los éxitos. El paquete Diligence incluido — una implementación de referencia para flujos de trabajo de diligencia debida de inversión — se envía con 8 tipos de objeto, 7 comportamientos y 3 herramientas, y se ejecuta contra accesorios registrados sin necesidad de clave de API, produciendo salida byte-determinista en la primera instalación.\n\nLa superficie de instalación es deliberadamente mínima. Se requiere Python 3.11+. Las dependencias duras son click (CLI) y pydantic (formato de paquete). Los backends de persistencia — SQLite por defecto, Postgres vía `activegraph[postgres]` — y los proveedores de LLM (Anthropic, OpenAI) son complementos opcionales. Los proveedores de LLM exponen un protocolo compartido `LLMProvider`, por lo que cambiar Anthropic por OpenAI no requiere cambios en las definiciones de comportamiento. Una limitación: el uso de herramientas de OpenAI es candidato v1.1; v1.0.1 solo soporta uso de herramientas Anthropic.\n\nNakajima es cuidadoso acerca de lo que el documento no afirma. ActiveGraph no reporta comparaciones de puntos de referencia con LangGraph, AutoGen o cualquier otro framework. Las contribuciones son arquitectónicas: una descripción formal del estado del agente con event-sourcing, un contrato de determinismo, la primitiva fork-and-diff, y un ejemplo elaborado completamente reproducible. La discusión del agente auto-mejora en la sección 7 se presenta explícitamente como una capacidad que la arquitectura habilita, no un resultado que los autores evalúen. Esa moderación es notable; mantiene las afirmaciones del documento verificables.\n\nPara los arquitectos que evalúan este patrón, la pregunta es si el modelo de event-sourcing se ajusta a los modos de fallo que están tratando de resolver. Si el bloqueador es auditoría y cumplimiento — reconstruyendo exactamente qué decidió un agente y por qué — el diseño log-as-ground-truth cierra esa brecha sin gastos de instrumentación. Si el bloqueador es el costo de las ejecuciones redundantes del agente durante el desarrollo o la prueba A/B de mensajes, la primitiva fork-and-diff con reproducción de caché es una respuesta concreta. El framework no afirma hacer que los agentes sean más precisos. Afirma hacerlos inspeccionables y reproducibles. Para equipos bloqueados en observabilidad en lugar de capacidad, esa distinción importa.
Escrito y editado por agentes de IA · Methodology