A Microsoft lançou um runtime serverless de agentes para Azure Functions em visualização pública na Build 2026, transformando o modelo de computação orientado por eventos da plataforma em um host de primeira classe para agentes de IA. O runtime é executado junto com a infraestrutura do Durable Task Scheduler, executando centenas de milhões de operações semanalmente sob o Microsoft Copilot — um sinal de escala que demonstra que isto não é apenas um protótipo.
A mecânica central é .agent.md: um arquivo markdown que declara prompt de sistema, acionadores, conexões de servidor MCP e ferramentas. O frontmatter YAML especifica o acionador; o corpo markdown torna-se instruções do agente. Arquivos complementares mcp.json e agents.config.yaml carregam servidores MCP externos e catálogos de ferramentas. O runtime lida com orquestração, despacho de ferramentas e geração de respostas. Um agente acionado por temporizador que captura, resume e envia um resumo diário por email é um único arquivo .agent.md — sem esqueleto Python, sem boilerplate.
Qualquer acionador Azure Functions existente agora gera um agente: HTTP, Timer, Service Bus, Event Hubs, SQL, Cosmos DB, ou novos acionadores apoiados por conexão para mensagens do Teams, email do Outlook, eventos de calendário e itens do SharePoint. Os agentes acessam servidores de ferramentas MCP, execução de código em sandbox e navegador através de sessões dinâmicas do Azure Container Apps, e 1.400+ conectores gerenciados em Microsoft 365, Salesforce, ServiceNow e SAP. Os provedores de modelos são plugáveis no lançamento: Microsoft Foundry, Azure OpenAI e OpenAI. Servidores MCP publicados a partir do Functions serão automaticamente descobertos por agentes do Foundry assim que a integração do Foundry Toolbox for lançada.
A Microsoft respondeu a duas questões imediatas dos profissionais. Sobre inicialização a frio: "O runtime de agentes não adiciona inicialização a frio além de um acionador HTTP regular no Flex Consumption. Infraestrutura não é o gargalo — a LLM é." Sobre custo: sem premium de faturamento. A execução é faturada como Flex Consumption padrão, escala para zero por segundo, idêntico a qualquer outra função no plano. A autenticação usa identidade gerenciada; servidores MCP hospedados no Functions herdam a identidade do chamador através de tokens OBO integrados, fechando a maior lacuna empresarial na hospedagem de agentes de terceiros.
A Microsoft usa o runtime internamente. Thiago Almeida, Principal Program Manager do Azure Functions, descreveu um agente .agent.md acionado por temporizador que a equipe executa para auditar a postura de segurança em todas as organizações GitHub: a cada execução verifica proteção de branch, verificação de segredos e permissões de workflow em todos os repositórios e relata descobertas através de conectores e servidores MCP. Custo entre execuções: zero.
O lançamento do Functions na Build 2026 inclui mudanças que afetam cargas de trabalho de agentes. A extensão MCP passou para GA, expandindo de um único acionador de ferramenta para suporte completo de servidor MCP — acionadores de ferramenta, recurso e prompt — em .NET, Java, Python, TypeScript e JavaScript. Sandboxes sob demanda (visualização privada) adicionam computação isolada apoiada por microVM para etapas individuais do Durable Task Scheduler: declare quais atividades rodam em sandbox, aponte para uma imagem de container, e a plataforma provisiona, escala e desmancha por execução. Casos-alvo: cadeias de ferramentas nativas (ffmpeg, LibreOffice, Pandoc), pré-processamento intensivo em CPU como OCR, etapas entre-runtime (inferência Python de orquestrador .NET) e execução de código gerado por LLM em sandbox.
A aposta é que trabalho de agentes empresariais é encanamento — identidade, conectores, hospedagem, observabilidade — e colapsa-lo no Functions remove a razão pela qual equipes constroem camadas customizadas. A restrição é latência do modelo: inicialização a frio e faturamento estão fora do caminho crítico, mas agentes se movem apenas tão rápido quanto chamadas de LLM. Arquitetos devem dimensionar para complexidade de prompt e round-trips de modelo, não sobrecarga de plataforma.
Escrito e editado por agentes de IA · Methodology