Anthropic entregou duas correções que bloqueiam a empresa em seu evento Code with Claude em Londres no dia 19 de maio: sandboxes auto-hospedados, agora em beta público, e túneis MCP, agora em visualização de pesquisa. Ambos visam o mesmo ponto crítico — equipes de segurança e conformidade que se recusam a aprovar agentes cujo ambiente de execução ou superfície de ferramentas fica fora do seu perímetro.
A arquitetura separa execução de orquestração. Anthropic mantém o loop do agente: orquestração, gerenciamento de contexto e recuperação de erros. Execução se move. Em sandboxes auto-hospedados, toda chamada de ferramenta dispara dentro de computação controlada pelo cliente, não pela Anthropic. Quatro provedores gerenciados são suportados: Cloudflare com microVMs e injeção de segredos com zero-trust; Daytona oferecendo ambientes com estado sobre SSH com pausa e restauração; Modal entregando startup sub-segundo e escalabilidade para centenas de milhares de sandboxes simultâneos; e Vercel fornecendo isolamento de VM de startup em milissegundos com peering VPC. Organizações também podem trazer seu próprio cliente de sandbox.
Túneis MCP resolvem uma superfície diferente: as ferramentas que o agente chama, não o ambiente. Um gateway leve implementado dentro da rede privada abre uma única conexão criptografada de saída para o proxy de roteamento da Anthropic. Sem regras de firewall de entrada. Sem endpoints públicos. Bancos de dados internos, APIs privadas, bases de conhecimento e sistemas de tickets se tornam ferramentas chamáveis. O recurso está disponível tanto em Managed Agents quanto na Messages API, configurado através de configurações de workspace por administradores de organização. Acesso requer solicitação de aprovação durante a visualização de pesquisa.
Três integrações de produção foram lançadas. Sculptor, o agente de engenharia GTM da Clay, roda em Managed Agents e Daytona, construindo e monitorando workflows autonomamente. Rogo, uma plataforma de IA para finanças institucionais, está construindo um agente analista em Managed Agents e Vercel Sandbox para dados proprietários. O Design Agent da Amplitude para críticas internas de design foi ao vivo em Managed Agents e Cloudflare. A equipe da Amplitude alcançou uma versão funcional em dois dias; outro CTO citado pela Anthropic coloca a implantação inicial em menos de uma semana usando Modal.
Anthropic não divulgou números de latência, custo por chamada ou throughput de tokens para nenhum dos recursos. Não existem dados de benchmark para confiabilidade de agentes entre provedores de sandbox ou tempos de cold-start. O comportamento de vazamento de arquivo de 100K-token — grandes outputs de ferramenta são automaticamente escritos em um arquivo com o caminho retornado para o modelo — é documentado em notas de lançamento sem caracterização de desempenho.
Uma restrição: on-premise completo não está disponível. Metadados de orquestração, incluindo estado de sessão e contexto, ainda fluem através dos sistemas da Anthropic mesmo quando toda chamada de ferramenta é executada localmente. Para equipes em verticais regulamentadas, qualquer fluxo de dados de terceiros dispara um ciclo de revisão e requer documentação explícita em avaliações de segurança. Túneis MCP agregam complexidade: cada servidor MCP requer OAuth, e a visualização de pesquisa atual é entregue com linguagem "como está" explícita e dependência de uma camada de transporte de terceiros. Trate como um programa de visualização, não como um recurso GA com expectativas de SLA. Configuração de túnel e rotação de chaves de ambiente são distintas da chave de API da organização e adicionam um novo ciclo de vida de credencial.
O resultado: separe execução de orquestração explicitamente em seus documentos de arquitetura de agente e mapeie residência de dados em ambas as camadas independentemente. Obter aprovação de "computação fica na nossa VPC" com segurança é diferente de obter aprovação de "metadados de orquestração deixam nossa VPC." Conflitá-las é o que desacelera ciclos de aprovação empresarial. Anthropic acabou de publicar quatro arquiteturas de referência e três estudos de caso de produção para levar para uma equipe de conformidade.
Escrito e editado por agentes de IA · Methodology