Meta planea lanzamiento de servicio de nube en julio de 2026: alquiler de GPU y Llama hospedado para desafiar AWS, Azure
Meta supuestamente está desarrollando un servicio de infraestructura en la nube llamado Meta Compute programado para lanzarse en julio de 2026 que alquilaría capacidad de GPU e alojaría modelos Llama de IA para clientes externos, según reportes que citan a personas familiarizadas con los planes. El movimiento representa un cambio fundamental de mantener la enorme infraestructura de IA de Meta estrictamente interna a monetizarla como servicio comercial. Meta ha gastado más de $30 mil millones en adquisición de GPU en 2024 e incrementó su pronóstico de capex 2026 a $125-145 mil millones, creando presión significativa para convertir esas inversiones de capital en ingresos.
Meta Compute se espera que ofrezca tres niveles de servicio: instancias de GPU bare-metal (hardware NVIDIA H100 dedicado y Rubin futuro a través de InfiniBand de alto ancho de banda), clústeres de entrenamiento gestionados para orquestación de cargas de trabajo de IA distribuida, y puntos finales REST hospedados para familia de modelos Llama (incluida sintonización fina y RAG). Fuentes de la industria sugieren que Meta podría reducir las tarifas de GPU en nube en un 20-30%, aprovechando su enorme poder de compra, chip de inferencia MTIA personalizado para ciertos trabajos y infraestructura de centro de datos ya depreciada. CoreWeave y Nebius, especialistas que capturaron decenas de miles de millones en el propio gasto de nube de Meta, enfrentaron reprecio inmediato (caída de 10%+) en el anuncio.
Meta enfrentará desafíos significativos de ejecución y confianza. El historial de confiabilidad de infraestructura de la empresa es inconsistente (interrupciones de DNS, inestabilidad de plataforma), y los clientes empresariales exigen disponibilidad de cinco nueves en múltiples regiones. Además, las herramientas de desarrollador de Windows son críticas: Meta supuestamente está contratando ingenieros con experiencia en Azure y Windows y planeando integración de Entra ID y Active Directory, además de una extensión de Visual Studio para envío de trabajo. Cumplimiento de la Ley de IA de la UE, preocupaciones antimonopolio sobre aprovechar el monopolio social de Meta para subvencionar servicios en la nube, y limitaciones iniciales de disponibilidad de GPU ralentizarán el impulso de lanzamiento.
Para arquitectos: Meta Compute es un evento de reprecio de mercado esperando suceder. Si se ejecuta incluso moderadamente bien, inyecta nueva oferta de GPU con precios competitivos, reduciendo presión de bloqueo en la nube. Las estrategias multi-nube se vuelven más defendibles. Sin embargo, hasta ser confirmado por Meta con precios publicados, SLA y disponibilidad regional, esto sigue siendo especulativo. Observe los anuncios de socios de acceso anticipado y enfrentamientos de benchmarks en H2 2026. Para orgs de Azure/Windows pesadas, la amenaza de interoperabilidad (u oportunidad) depende de la paridad de Entra ID y Active Directory—algo que Meta comercializará fuertemente.
Fuentes
- Primary source
- windowsnews.ai
“Meta Compute cloud GPU service July 2026 launch; GPU rental + hosted Llama; 20-30% undercut of current rates; MTIA custom silicon; Entra ID integration planned”
- tomshardware.com
“Meta raised 2026 capex to $125-145B; CoreWeave and Nebius stocks fell 10%+ on report; Meta committed ~$48B to rent GPU capacity from CoreWeave, Nebius; now planning to compete directly”
- windowsnews.ai
“Meta hiring Windows and Azure engineers; SDK preview expected early 2026; Visual Studio extension in works; Entra ID, Active Directory integration planned”
- nvidianews.nvidia.com
“Meta deploying millions of NVIDIA Blackwell and Rubin GPUs; multi-year strategic partnership with NVIDIA; expanding Grace CPU deployment”