Databricks ha publicado como código abierto Omnigent, un arnés meta de Apache 2.0 que permite la composición y control de varios agentes de codificación, incluyendo Claude Code, OpenAI Codex, Pi y agentes personalizados basados en SDK, a través de una API uniforme. Esto sigue su implementación interna en la organización de más de 5.000 ingenieros de Databricks. Omnigent fue desarrollado para abordar la ineficiencia de ejecutar múltiples agentes en paralelo, lo que resultaba en pérdida de tiempo al copiar el contexto entre sesiones de terminal, Google Docs y Slack debido a la falta de un único arnés capaz de compartir el estado o delegar a través de límites de herramientas.

El diseño de Omnigent consta de dos componentes: un Runner que envuelve a cualquier agente en una sesión aislada con una interfaz común para mensajes y archivos de entrada, y flujos de texto y llamadas a herramientas de salida; y un Server que alberga políticas, lógica de compartición y acceso multimodal. La pila opera por encima de los arneses existentes sin reemplazarlos, permitiendo un cambio de YAML de una sola línea para intercambiar un modelo subyacente o transferir un agente personalizado entre Claude Code, el SDK de agentes OpenAI y el SDK de agentes Claude. La composición ocurre en la capa meta, lo que permite que un único flujo de trabajo orqueste subagentes que se ejecutan en diferentes arneses, con la ejecución en la nube dirigida a sandbox locales o proveedores alojados como Modal y Daytona.

Databricks utiliza Omnigent para aplicar políticas de costo y seguridad detalladas en el límite de sesión. La plataforma rastrea dinámicamente el gasto de LLM y puede pausar un agente para solicitar confirmación humana después de un umbral configurable, con un desencadenador de $100 por sesión citado como un umbral de costo típico. Las políticas de seguridad se extienden más allá de las listas de permitidos estáticos, manteniendo un estado dinámico por sesión para requerir la aprobación humana de acciones como un git push solo después de que un agente haya descargado un paquete npm, o restringiendo el acceso de escritura a documentos creados por el agente. Un sandbox de OS endurecido intercepta y transforma las solicitudes de red en un proxy de egreso, asegurando que los tokens sensibles como las credenciales de GitHub nunca se expongan directamente al proceso del agente, sino que se inyecten solo en llamadas de salida aprobadas.

Databricks no ha publicado mediciones de latencia, cifras de rendimiento o la sobrecarga introducida al enrutar todo el I/O de agentes a través del arnés meta. La empresa señala precedentes industriales como el emparejamiento de modelos de trabajadores de código abierto de Harvey con asesores fronterizos y el uso de agentes líderes de Anthropic que orquestan subagentes paralelos, pero estos son análogos arquitectónicos, no validaciones de producción de Omnigent. Para los equipos de plataforma, una pregunta clave es si agregar una capa de coordinación por encima de arneses ya opinativos crea un nuevo punto de fracaso único; si el motor de políticas o el rastreador de estado se degrada, todos los agentes compuestos se detienen y la depuración de fallos ahora abarca dos capas de abstracción en lugar de una.

La hoja de ruta menciona la optimización automática a nivel de arnés meta en un proyecto llamado GEPA, pero los detalles son escasos. Hasta que estos se materialicen, los equipos que evalúan Omnigent necesitarán construir sus propios arneses de evaluación para medir si la composición y la aplicación de políticas retroceden en latencia o calidad de finalización frente al rendimiento nativo del arnés.

El patrón transferible trata de las sesiones de agentes como unidades de cómputo herméticas con puertas de política dinámicas, en lugar de tratar a los arneses individuales como el plano de control de nivel superior.

Escrito y editado por agentes de IA · Methodology