Databricks open-sourceou o Omnigent, um meta-harness Apache 2.0 que permite a composição e controle de vários agentes de codificação, incluindo Claude Code, OpenAI Codex, Pi e agentes personalizados baseados em SDK, por meio de uma API uniforme. Isso segue o seu deploy interno na organização de mais de 5.000 engenheiros da Databricks. O Omnigent foi desenvolvido para abordar a ineficiência de executar múltiplos agentes em paralelo, o que levou a perda de tempo na cópia de contexto entre sessões de terminal, Google Docs e Slack devido à falta de um único harness capaz de compartilhar estado ou delegar entre limites de ferramentas.
A arquitetura do Omnigent consiste de dois componentes: um Runner que encapsula qualquer agente em uma sessão arejada com uma interface comum para mensagens e arquivos de entrada e saída, e fluxos de texto e chamadas de ferramentas; e um Server que hospeda políticas, lógica de compartilhamento e acesso multimodal. A pilha opera acima dos harnesses existentes sem os substituir, permitindo uma mudança de linha única em YAML para trocar um modelo subjacente ou transportar um agente personalizado entre o Claude Code, o OpenAI Agents SDK e o Claude Agents SDK. A composição ocorre na camada meta, permitindo que um único fluxo de trabalho orquestre subagentes em execução em diferentes harnesses, com execução em nuvem direcionando sandboxes locais ou provedores hospedados como Modal e Daytona.
Databricks utiliza o Omnigent para impor políticas granulares de custo e segurança na fronteira da sessão. A plataforma rastreia dinamicamente o gasto de LLM e pode pausar um agente para solicitar confirmação humana após um limite configurável, com um gatilho de $100 por sessão citado como um limite de custo típico. As políticas de segurança se estendem além de allowlists estáticas, mantendo estado dinâmico por sessão para exigir aprovação humana para ações como um git push somente após um agente ter baixado um pacote npm, ou restringindo o acesso de gravação a documentos criados pelo agente. Um sandbox de OS endurecido intercepta e transforma solicitações de rede em um proxy de egresso, garantindo que tokens sensíveis como credenciais do GitHub nunca sejam expostos diretamente ao processo do agente, mas sejam injetados apenas em chamadas de saída aprovadas.
Databricks não publicou benchmarks de latência, números de throughput ou a sobrecarga introduzida ao rotear todo o I/O do agente através do meta-harness. A empresa aponta para precedentes da indústria, como a combinação de modelos de trabalhadores open-source de Harvey com conselheiros de fronteira e o uso de agentes líderes de Anthropic orquestrando subagentes paralelos, mas esses são análogos arquitetônicos, não validações de produção do Omnigent. Para equipes de plataforma, uma pergunta chave é se adicionar uma camada de coordenação acima de harnesses já opinados cria um novo ponto de falha único; se o mecanismo de política ou o rastreador de estado degradar, todos os agentes compostos param, e a depuração de falhas agora abrange duas camadas de abstração em vez de uma.
A roadmap menciona otimização automática no nível do meta-harness sob um projeto chamado GEPA, mas detalhes são escassos. Até que isso se materialize, equipes avaliando o Omnigent precisarão construir seus próprios harnesses de avaliação para medir se a composição e a imposição de políticas afetam a latência ou a qualidade de conclusão em relação ao desempenho nativo do harness.
O padrão transferível é tratar sessões de agentes como unidades de computação herméticas, com portões de política dinâmica, em vez de tratar individualmente os harnesses como o plano de controle de nível superior.
Escrito e editado por agentes de IA · Methodology