AKS en bare metal de Microsoft alcanza vista previa pública; añade Ray y Fleet Manager para IA de borde a nube
Microsoft anunció en Build 2026 que Azure Kubernetes Service (AKS) ahora se ejecuta directamente en hardware bare-metal en vista previa pública, eliminando la capa de hipervisor y dando a los workloads acceso directo a NVLink, RDMA y red de alto rendimiento. La característica apunta al entrenamiento de modelo de lenguaje grande e inferencia sensible a la latencia donde la sobrecarga de virtualización impacta mediblemente el desempeño y costo. AKS en bare metal se integra con Azure Arc para aprovisionamiento y administración nativos de la nube, por lo que la experiencia permanece consistente ya sea en ejecución en dispositivos de borde, centros de datos o regiones de nube.
Simultáneamente, Microsoft anunció Anyscale en Azure (Ray administrado en vista previa pública) para orquestar workloads de IA distribuidos en CPUs y GPUs en clusters AKS escalables dinámicamente. Azure Kubernetes Fleet Manager está ahora disponible en general, extendiendo política centralizada, colocación de workload y gobernanza RBAC en estados de cluster híbrido y multi-nube. Estas actualizaciones tienen como objetivo hacer que Kubernetes—en lugar de stacks de infraestructura de IA personalizados—sea la columna vertebral operativa para entrenamiento e inferencia a escala.
Managed System Node Pools está ahora GA, administrando automáticamente la capacidad del componente de sistema e inserciones para prevenir contención de recursos con workloads GPU. AI Runway, un marco de entrega de modelo nativo de Kubernetes, permite a los usuarios seleccionar modelos, validar requisitos de GPU, estimar costos e iniciar endpoints de producción a través del aprovisionamiento KAITO y runtimes vLLM. El soporte bare-metal está inicialmente disponible en servidores Dell y HPE validados; la certificación más amplia sigue antes de fin de año.
Para arquitectos de infraestructura: La opción bare-metal señala aceptación empresarial de Kubernetes para producción de IA cuando la sobrecarga de virtualización se vuelve inaceptable. Combinado con Fleet Manager (ahora GA), esto posiciona AKS como un plano de control unificado de borde a nube, reduciendo la fragmentación operativa para organizaciones que administran topologías de hardware diversas y workloads sensibles.
Fuentes
- Primary source
- infoq.com
“AKS on Bare Metal, currently in public preview. By removing the virtualization layer, AKS can now provide direct access to technologies such as NVLink, RDMA, and high-performance networking”
- blog.aks.azure.com
“AKS now runs directly on bare-metal, small-form-factor devices at the edge, available today in public preview”
- techcommunity.microsoft.com
“Anyscale on Azure, now in public preview, brings managed Ray to AKS”
- techcommunity.microsoft.com
“Azure Kubernetes Service (AKS), the fully-managed enterprise-grade Kubernetes service, now runs directly on bare metal”