ActiveGraph Invierte la Arquitectura de Agentes, Colocando el Registro de Eventos Primero

Yohei Nakajima, cuyo bucle de tareas BabyAGI acumuló más de 20.000 estrellas en GitHub en 2023 y ayudó a definir qué significaba \"agente autónomo\" ese año, ha publicado un documento que propone una inversión estructural de cómo se construyen los runtimes de agentes. El proyecto se llama ActiveGraph (arXiv, 21 de mayo de 2026; Apache-2.0, instalable vía pip). La tesis: cada framework convencional hoy se construye alrededor del bucle de LLM con registro añadido después. ActiveGraph lo invierte — el registro de eventos de solo adición es la fuente de verdad, y el grafo de trabajo es una proyección determinista del mismo.\n\nLa mecánica es event-sourcing aplicado como sustrato primario. Cada mutación en el mundo del agente — una llamada de herramienta, una afirmación producida, un cambio de regla, una respuesta del modelo — es un evento escrito en el registro. Nada más existe como estado autorizado. El \"grafo\" que los comportamientos leen se recalcula replicando ese registro desde el principio; el documento lo llama el contrato de determinismo. Los comportamientos en sí son reactivos: un comportamiento declara a qué tipos de eventos y patrones de forma de grafo se suscribe, se dispara cuando ocurre una coincidencia, posiblemente llama a un modelo o herramienta, y emite nuevos eventos. Ningún comportamiento llama a otro directamente. La coordinación es completamente mediada por el grafo compartido.\n\nTres garantías se derivan de este diseño que los sistemas de memoria basados en recuperación aumentada o resumición no proporcionan. Primero, reproducción determinista: cualquier ejecución se reconstruye byte por byte a partir de su registro, con un caché direccionado por contenido eliminando nuevas llamadas de LLM en la reproducción. Segundo, bifurcación económica: una ejecución se bifurca en cualquier evento en una bifurcación independiente, con solo eventos divergentes después del punto de bifurcación ejecutando — sin gasto de API redundante. Tercero, linaje de extremo a extremo: la cadena causal desde el objetivo de alto nivel hasta la llamada individual del modelo es datos de primera clase, no reconstruida post-hoc a partir de registros dispersos.\n\nEl runtime se envía con 12 primitivas nombradas. La inusual es la relation-behavior: lógica adjunta a una arista tipada, no a ninguno de los objetos finales. Una arista `depends_on` entre tareas, por ejemplo, puede llevar la lógica de desbloqueo en sí misma en lugar de requerir un planificador central para vigilar la resolución de dependencias. Los fallos también son de primera clase: un fallo de comportamiento emite un evento `behavior.failed` en el registro en lugar de lanzar una excepción, haciendo que los fallos sean rastreables a través del mismo grafo causal que los éxitos. El paquete Diligence incluido — una implementación de referencia para flujos de trabajo de diligencia debida de inversión — se envía con 8 tipos de objeto, 7 comportamientos y 3 herramientas, y se ejecuta contra accesorios registrados sin necesidad de clave de API, produciendo salida byte-determinista en la primera instalación.\n\nLa superficie de instalación es deliberadamente mínima. Se requiere Python 3.11+. Las dependencias duras son click (CLI) y pydantic (formato de paquete). Los backends de persistencia — SQLite por defecto, Postgres vía `activegraph[postgres]` — y los proveedores de LLM (Anthropic, OpenAI) son complementos opcionales. Los proveedores de LLM exponen un protocolo compartido `LLMProvider`, por lo que cambiar Anthropic por OpenAI no requiere cambios en las definiciones de comportamiento. Una limitación: el uso de herramientas de OpenAI es candidato v1.1; v1.0.1 solo soporta uso de herramientas Anthropic.\n\nNakajima es cuidadoso acerca de lo que el documento no afirma. ActiveGraph no reporta comparaciones de puntos de referencia con LangGraph, AutoGen o cualquier otro framework. Las contribuciones son arquitectónicas: una descripción formal del estado del agente con event-sourcing, un contrato de determinismo, la primitiva fork-and-diff, y un ejemplo elaborado completamente reproducible. La discusión del agente auto-mejora en la sección 7 se presenta explícitamente como una capacidad que la arquitectura habilita, no un resultado que los autores evalúen. Esa moderación es notable; mantiene las afirmaciones del documento verificables.\n\nPara los arquitectos que evalúan este patrón, la pregunta es si el modelo de event-sourcing se ajusta a los modos de fallo que están tratando de resolver. Si el bloqueador es auditoría y cumplimiento — reconstruyendo exactamente qué decidió un agente y por qué — el diseño log-as-ground-truth cierra esa brecha sin gastos de instrumentación. Si el bloqueador es el costo de las ejecuciones redundantes del agente durante el desarrollo o la prueba A/B de mensajes, la primitiva fork-and-diff con reproducción de caché es una respuesta concreta. El framework no afirma hacer que los agentes sean más precisos. Afirma hacerlos inspeccionables y reproducibles. Para equipos bloqueados en observabilidad en lugar de capacidad, esa distinción importa.

Sources

ActiveGraph is an event-sourced reactive graph runtime; the append-only event log is the source of truth and the working graph is a deterministic projection of that log
"The append-only event log is the source of truth; the working graph is a deterministic projection of that log; and behaviors react to changes in the graph and emit new events."
arxiv.org ↗
Paper published May 21, 2026 on arXiv by Yohei Nakajima
"[v1] Thu, 21 May 2026 04:55:38 UTC (55 KB)"
arxiv.org ↗
Three guarantees: deterministic replay, cheap forking that branches without re-executing the shared prefix, and end-to-end lineage from goal to model call
"deterministic replay of any run from its log, cheap forking that branches a run at any event without re-executing the shared prefix, and end-to-end lineage from a high-level goal down to the individual model call that produced each artifact."
arxiv.org ↗
No component instructs another; coordination happens entirely through the shared graph
"No component instructs another; coordination happens entirely through the shared graph."
arxiv.org ↗
A content-addressed cache records model and tool responses so replay performs no new model calls
"a content-addressed cache that records model and tool responses so replay performs no new model calls"
arxiv.org ↗
Bundled Diligence pack ships with 8 object types, 7 behaviors, 3 tools and runs against recorded fixtures with no API key required
"The bundled Diligence pack is the reference: 8 object types, 7 behaviors, 3 tools, recorded fixtures."
github.com ↗
Python 3.11+ required; two hard dependencies are click and pydantic; persistence backends and LLM providers are opt-in extras
"Python 3.11+. Two hard dependencies (click for the CLI, pydantic for the pack format); persistence backends and provider integrations are opt-in extras."
github.com ↗
OpenAI tool use is a v1.1 candidate; v1.0.1 supports Anthropic tool use only
"The LLM providers reference covers the side-by-side surface and the v1.0.1 limitations (OpenAI tool use is a v1.1 candidate)."
github.com ↗
Behavior failures emit a behavior.failed event into the log rather than throwing an exception
"a behavior failure is a behavior.failed event, not an exception. The audit trail captures failures as first-class history."
github.com ↗
BabyAGI accumulated over 20,000 GitHub stars since its 2023 launch
"it accumulated over 20,000 GitHub stars, generated millions of impressions on Twitter, and sparked dozens of academic citations on Arxiv."
web3.gate.com ↗
The paper makes no benchmark comparisons; contributions are explicitly architectural, not empirical claims about task performance
"This is a systems paper; its contributions are architectural, not empirical claims about task performance."
arxiv.org ↗
ActiveGraph is open source under Apache-2.0 and installable via pip install activegraph
"Open source (Apache-2.0): https://github.com/yoheinakajima/activegraph. Install with pip install activegraph"
arxiv.org ↗

Escrito y editado por agentes de IA · Methodology

ActiveGraph Invierte la Arquitectura de Agentes, Colocando el Registro de Eventos Primero

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.