Databricks abre codigo de Omnigent meta-harness para orquestracao multi-agentes com controle de custo; aborda sobrecargas de orcamento de IA de $500M/mes
Databricks abriu o codigo de Omnigent, uma meta-harness para orquestrar multiplos agentes de IA sob um plano de controle unico, lancada em 13 de junho sob licenca Apache 2.0 e anunciada em alpha antecipado. Omnigent envolve harnesses de agentes existentes—Claude Code, OpenAI Codex, Inflection Pi, LangGraph, CrewAI—sem modifica-los, fornecendo uma API unificada para composicao, governanca e colaboracao em equipe. Opera na camada de orquestracao acima de tempos de execucao de agentes individuais, aplicando politicas com estado (orcamentos de custo, acesso ao sistema de arquivos, limites de rede, aprovacoes human-in-the-loop) fora da camada de prompt LLM.
A motivacao eh aguda: Uber gastou seu orcamento completo de IA de 2026 em quatro meses enquanto 5.000 engenheiros nao monitorados executavam sessoes de Claude Code, com usuarios pesados atingindo $500-2.000 por mes. Uma empresa nao identificada gastou $500 milhoes em um unico mes antes que equipes de financas interviessem. Gartner prevê que 40% dos projetos de agentes de IA serao cancelados ate 2027 devido a espirais de custos e controles de risco inadequados. O controle de custo do Omnigent se situa na camada de infraestrutura: ele pausa sessoes quando limites de gasto sao excedidos e requer confirmacao humana antes de prosseguir. O suporte para coordenacao multi-agentes permite que equipes componham agentes especializados (planejador, implementador, revisor, validador) em fluxos de trabalho com contexto compartilhado e portas de aprovacao.
Omnigent se integra com Unity AI Gateway, a camada de governanca em tempo de execucao da Databricks anunciada na summit. Gateway aplica controles de custo centralizados (visibilidade de gasto em provedores, limites de gasto rigidos, roteamento inteligente), politicas de acesso e observabilidade unificada para todas as interacoes de agente. Parceiros de integracao incluem Palo Alto Networks (Prisma AIRS para inspecao em tempo real) e Zscaler (AI Guardrails para controles baseados em resultado). A arquitetura separa harnesses de agente da aplicacao de politica: regras vivem fora do prompt e nao podem ser raciocinhadas ao redor porque a sandbox aplica restricoes antes de qualquer LLM receber entrada.
Para praticantes: Omnigent eh producao-alpha; avalie em ambientes de teste antes de implantacao critica. O modelo de governanca fora de prompt eh arquitetonicamente som—imune a injecao de prompt porque restricoes sao aplicadas na camada de orquestracao, nao no prompt. Essa resiliencia importa para equipes reconstruindo fluxos de trabalho apos a proibicao de exportacao Anthropic Fable 5: governanca na camada de orquestracao sobrevive a disrupcoes de nivel de modelo. Monitore: (1) versoes de estabilidade e casos de estudo de usuarios iniciais, (2) suporte para harnesses adicionais (GitHub Copilot Workspace, Cursor, etc.), (3) preco Omnigent gerenciado vs auto-hospedado. Visibilidade de custo eh agora essencial para implantacao de agentes em escala.