AKS em bare metal da Microsoft atinge visualização pública; adiciona Ray e Fleet Manager para IA de borda a nuvem
Microsoft anunciou no Build 2026 que Azure Kubernetes Service (AKS) agora funciona diretamente em hardware bare-metal em visualização pública, eliminando a camada de hipervisor e dando aos workloads acesso direto a NVLink, RDMA e rede de alto desempenho. O recurso visa treinamento de modelo de linguagem grande e inferência sensível à latência onde a overhead de virtualização impacta mensuramente o desempenho e custo. AKS em bare metal integra com Azure Arc para provisionamento e gerenciamento nativos da nuvem, portanto a experiência permanece consistente seja em execução em dispositivos de borda, data centers ou regiões da nuvem.
Simultaneamente, Microsoft anunciou Anyscale no Azure (Ray gerenciado em visualização pública) para orquestrar workloads de IA distribuídos em CPUs e GPUs em clusters AKS dinamicamente dimensionáveis. Azure Kubernetes Fleet Manager está agora disponível em geral, estendendo política centralizada, posicionamento de workload e governança RBAC em estados de cluster híbrido e multi-nuvem. Essas atualizações visam tornar Kubernetes—em vez de stacks de infraestrutura de IA bespoke—a coluna vertebral operacional para treinamento e inferência em escala.
Managed System Node Pools está agora GA, gerenciador automático de capacidade de componente de sistema e patches para prevenir contenção de recursos com workloads GPU. AI Runway, um framework de serviço de modelo nativo de Kubernetes, permite aos usuários selecionar modelos, validar requisitos de GPU, estimar custos e lançar endpoints de produção via provisionamento KAITO e runtimes vLLM. O suporte bare-metal está inicialmente disponível em servidores Dell e HPE validados; certificação mais ampla segue até final do ano.
Para arquitetos de infraestrutura: A opção bare-metal sinaliza aceitação empresarial de Kubernetes para produção de IA quando a taxa de virtualização se torna inaceitável. Combinado com Fleet Manager (agora GA), isso posiciona AKS como um plano de controle unificado de borda a nuvem, reduzindo fragmentação operacional para organizações gerenciando topologias de hardware diversas e workloads sensíveis.
Fontes
- Primary source
- infoq.com
“AKS on Bare Metal, currently in public preview. By removing the virtualization layer, AKS can now provide direct access to technologies such as NVLink, RDMA, and high-performance networking”
- blog.aks.azure.com
“AKS now runs directly on bare-metal, small-form-factor devices at the edge, available today in public preview”
- techcommunity.microsoft.com
“Anyscale on Azure, now in public preview, brings managed Ray to AKS”
- techcommunity.microsoft.com
“Azure Kubernetes Service (AKS), the fully-managed enterprise-grade Kubernetes service, now runs directly on bare metal”