Databricks implementa Omnigent entre 5.000 ingenieros para coordinar agentes paralelos

Databricks ha publicado como código abierto Omnigent, un arnés meta de Apache 2.0 que permite la composición y control de varios agentes de codificación, incluyendo Claude Code, OpenAI Codex, Pi y agentes personalizados basados en SDK, a través de una API uniforme. Esto sigue su implementación interna en la organización de más de 5.000 ingenieros de Databricks. Omnigent fue desarrollado para abordar la ineficiencia de ejecutar múltiples agentes en paralelo, lo que resultaba en pérdida de tiempo al copiar el contexto entre sesiones de terminal, Google Docs y Slack debido a la falta de un único arnés capaz de compartir el estado o delegar a través de límites de herramientas.

El diseño de Omnigent consta de dos componentes: un Runner que envuelve a cualquier agente en una sesión aislada con una interfaz común para mensajes y archivos de entrada, y flujos de texto y llamadas a herramientas de salida; y un Server que alberga políticas, lógica de compartición y acceso multimodal. La pila opera por encima de los arneses existentes sin reemplazarlos, permitiendo un cambio de YAML de una sola línea para intercambiar un modelo subyacente o transferir un agente personalizado entre Claude Code, el SDK de agentes OpenAI y el SDK de agentes Claude. La composición ocurre en la capa meta, lo que permite que un único flujo de trabajo orqueste subagentes que se ejecutan en diferentes arneses, con la ejecución en la nube dirigida a sandbox locales o proveedores alojados como Modal y Daytona.

Databricks utiliza Omnigent para aplicar políticas de costo y seguridad detalladas en el límite de sesión. La plataforma rastrea dinámicamente el gasto de LLM y puede pausar un agente para solicitar confirmación humana después de un umbral configurable, con un desencadenador de $100 por sesión citado como un umbral de costo típico. Las políticas de seguridad se extienden más allá de las listas de permitidos estáticos, manteniendo un estado dinámico por sesión para requerir la aprobación humana de acciones como un git push solo después de que un agente haya descargado un paquete npm, o restringiendo el acceso de escritura a documentos creados por el agente. Un sandbox de OS endurecido intercepta y transforma las solicitudes de red en un proxy de egreso, asegurando que los tokens sensibles como las credenciales de GitHub nunca se expongan directamente al proceso del agente, sino que se inyecten solo en llamadas de salida aprobadas.

Databricks no ha publicado mediciones de latencia, cifras de rendimiento o la sobrecarga introducida al enrutar todo el I/O de agentes a través del arnés meta. La empresa señala precedentes industriales como el emparejamiento de modelos de trabajadores de código abierto de Harvey con asesores fronterizos y el uso de agentes líderes de Anthropic que orquestan subagentes paralelos, pero estos son análogos arquitectónicos, no validaciones de producción de Omnigent. Para los equipos de plataforma, una pregunta clave es si agregar una capa de coordinación por encima de arneses ya opinativos crea un nuevo punto de fracaso único; si el motor de políticas o el rastreador de estado se degrada, todos los agentes compuestos se detienen y la depuración de fallos ahora abarca dos capas de abstracción en lugar de una.

La hoja de ruta menciona la optimización automática a nivel de arnés meta en un proyecto llamado GEPA, pero los detalles son escasos. Hasta que estos se materialicen, los equipos que evalúan Omnigent necesitarán construir sus propios arneses de evaluación para medir si la composición y la aplicación de políticas retroceden en latencia o calidad de finalización frente al rendimiento nativo del arnés.

El patrón transferible trata de las sesiones de agentes como unidades de cómputo herméticas con puertas de política dinámicas, en lugar de tratar a los arneses individuales como el plano de control de nivel superior.

Sources

Omnigent is open-sourced under Apache 2.0 as a meta-harness for composing Claude Code, OpenAI Codex, Pi, and custom agents through a uniform API
"That's why today we're open sourcing Omnigent under Apache 2.0."
databricks.com ↗
Databricks deployed coding agents across its 5,000+ member engineering organization
"At Databricks, we adopted coding agents early across our 5000+ member engineering team and built thousands of agents for customers."
databricks.com ↗
Engineers routinely ran four to five agents in parallel, copy-pasting context between tools
"we often have 4-5 agents open at once (coding agents, Gemini search, etc) and spend our time copy-pasting text between them and Docs, Slack, and other collaboration tools."
databricks.com ↗
Omnigent architecture: a Runner wraps agents in sandboxed sessions with a uniform API; a Server provides policies and sharing
"A runner wraps any agent in a sandboxed session with a uniform API. A server provides policies and sharing, and exposes every session over the terminal, the app, and web APIs."
databricks.com ↗
A one-line YAML change can swap underlying model or port a custom agent between harnesses
"Specify a custom agent as a YAML and port it across harnesses with a one-line change, or combine subagents using different harnesses in the same agent."
databricks.com ↗
Cost policies can pause an agent and request confirmation after a $100 per-session LLM spend threshold
"you can ask Omnigent to pause an agent and ask to continue after every $100 it spends."
databricks.com ↗
Contextual security policies track dynamic session state — e.g., require human approval for git push after an npm package download
"you can say that after an agent downloads a new package from npm, it should require human approval to git push"
databricks.com ↗
OS sandbox intercepts network requests at an egress proxy so GitHub tokens are never exposed to the agent process directly
"don't let an agent ever see your GitHub security token, but instead, inject it only in the egress proxy on approved requests"
databricks.com ↗
Harvey beat a frontier model on quality and cost by pairing an open-source worker model with a frontier advisor
"Harvey beat a frontier model on quality and cost by giving an open-source worker model a frontier advisor it can call"
databricks.com ↗
Anthropic built its research product as a lead agent orchestrating parallel subagents
"Anthropic built its research product as a lead agent orchestrating parallel subagents"
databricks.com ↗
Databricks Genie uses different LLMs for planning, search, and code generation
"our own Genie uses different LLMs for planning, search, and code generation"
databricks.com ↗
Roadmap includes automatic optimization at the meta-harness level under a project called GEPA
"Some items on our roadmap include automatic optimization at the meta-harness level with GEPA"
databricks.com ↗

Escrito y editado por agentes de IA · Methodology

Databricks implementa Omnigent entre 5.000 ingenieros para coordinar agentes paralelos

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.