Meta planeja lançamento de serviço de nuvem em julho de 2026: aluguel de GPU e Llama hospedada para desafiar AWS, Azure
Meta está supostamente desenvolvendo um serviço de infraestrutura de nuvem chamado Meta Compute previsto para lançamento em julho de 2026, que alugaria capacidade de GPU e hospedaria modelos Llama de IA para clientes externos, segundo relatórios citando pessoas familiarizadas com os planos. O movimento representa uma mudança fundamental de manter a enorme infraestrutura de IA da Meta estritamente interna para monetizá-la como um serviço comercial. Meta gastou mais de $30 bilhões na aquisição de GPU em 2024 e elevou sua previsão de capex 2026 para $125-145 bilhões, criando pressão significativa para transformar esses investimentos de capital em receita.
Meta Compute deve oferecer três níveis de serviço: instâncias de GPU bare-metal (hardware NVIDIA H100 dedicado e Rubin futuro via InfiniBand de alta largura de banda), clusters de treinamento gerenciado para orquestração de cargas de trabalho de IA distribuída, e endpoints REST hospedados para família de modelos Llama (incluindo fine-tuning e RAG). Fontes do setor sugerem que Meta pode cortar as taxas de GPU em nuvem em 20-30%, aproveitando seu enorme poder de compra, chip de inferência MTIA personalizado para determinadas cargas de trabalho e infraestrutura de data center já depreciada. CoreWeave e Nebius, especialistas que capturaram dezenas de bilhões no próprio gasto de nuvem da Meta, enfrentaram reprecificação imediata (queda de 10%+) no anúncio.
Meta enfrentará desafios significativos de execução e confiança. O histórico de confiabilidade da infraestrutura da empresa é manchado (interrupções de DNS, instabilidade de plataforma), e clientes empresariais exigem uptime de cinco noves em múltiplas regiões. Além disso, ferramentas para desenvolvedores Windows são críticas: Meta está supostamente contratando engenheiros com experiência em Azure e Windows e planejando integração com Entra ID e Active Directory, além de uma extensão do Visual Studio para envio de trabalhos. Conformidade com a Lei de IA da UE, preocupações antitrust sobre aproveitar o monopólio social do Meta para subvencionar serviços em nuvem e limitações iniciais de disponibilidade de GPU atrasaro toda a dinâmica de lançamento.
Para arquitetos: Meta Compute é um evento de reprecificação de mercado esperando para acontecer. Se executado mesmo moderadamente bem, injeta nova oferta de GPU com preços competitivos, reduzindo pressão de bloqueio de nuvem. Estratégias multi-nuvem ficam mais defendáveis. No entanto, até ser confirmado pela Meta com preço publicado, SLAs e disponibilidade regional, isso permanece especulativo. Fique atento a anúncios de parceiros de acesso antecipado e showdowns de benchmarks em H2 2026. Para orgs pesadas em Windows/Azure, a ameaça de interoperabilidade (ou oportunidade) depende da paridade do Entra ID e Active Directory—algo que Meta comercializará pesadamente.
Fontes
- Primary source
- windowsnews.ai
“Meta Compute cloud GPU service July 2026 launch; GPU rental + hosted Llama; 20-30% undercut of current rates; MTIA custom silicon; Entra ID integration planned”
- tomshardware.com
“Meta raised 2026 capex to $125-145B; CoreWeave and Nebius stocks fell 10%+ on report; Meta committed ~$48B to rent GPU capacity from CoreWeave, Nebius; now planning to compete directly”
- windowsnews.ai
“Meta hiring Windows and Azure engineers; SDK preview expected early 2026; Visual Studio extension in works; Entra ID, Active Directory integration planned”
- nvidianews.nvidia.com
“Meta deploying millions of NVIDIA Blackwell and Rubin GPUs; multi-year strategic partnership with NVIDIA; expanding Grace CPU deployment”