China Expande Clusters de GPU Domésticos; Moore Threads, Huawei, Alibaba Cada Uma Implanta Infraestrutura com 10.000 Cartões
A China está expandindo rapidamente a infraestrutura de código aberto de IA, com vários fabricantes de chips domésticos agora operando clusters de 10.000 GPUs para reduzir dependência do silício NVIDIA restrito à exportação e construir capacidade de IA soberana. Moore Threads apresentou seu cluster de computação inteligente 'Kua E' com 10.000 GPUs e 10 Exa-Flops de capacidade de computação de ponto flutuante e relatou 60% de MFU (utilização de FLOPs do modelo) no treinamento denso de modelo em grande escala e 40% em modelos de mistura de especialistas. Shenzhen ativou o primeiro cluster de 10.000 cartões da China alimentado por chips IA Ascend 910C de Huawei, entregando 11.000 petaflops de capacidade de computação. Alibaba também lançou um cluster de 10.000 cartões com chips Zhenwu de T-Head, com taxa de reser va de 92% entre aproximadamente 50 institutos que assinaram acordos de estrutura.
Esses clusters representam uma mudança estratégica longe da dependência em H100s e H200s da NVIDIA—restrita sob controles de exportação dos EUA—em direção a pilhas de chips indígenas otimizadas para o ecossistema de internet fragmentado da China e prioridades de IA estatal. O Ascend 910C de Huawei atinge aproximadamente 60% do desempenho de inferência H100 da NVIDIA, suficiente para implantação em larga escala. O Zhenwu 810E de T-Head (apresentado em janeiro de 2026) anuncia desempenho comparável ao H20 da NVIDIA (um chip propositalmente enfraquecido em conformidade com controle de exportação). A linha Siyuan 590/690 de Cambricon, Kunlun P800 de Baidu e C600 de MetaX agora são enviados em clusters de unidades de mílhares, com CATL e hipercalas domésticos coordenando infraestrutura de potência e resfriamento.
A construção de mega-clusters reflete expansão de capacidade mais ampla: Huawei visa 600.000 unidades Ascend 910C em 2026; Cambricon visa 500.000 chips (300K Siyuan 590/690 combinado); Alibaba enviou ~270.000 chips Zhenwu em 2025 e está acelerando. Coletivamente, fabricantes de chips de IA chineses enviaram aproximadamente 500K–800K chips de IA domésticos em 2025. O Fundo Nacional de Indústria de IA com suporte estatal priorizou construção de infraestrutura, e governos regionais estão oferecendo acordos de potência e terra alinhados com política industrial.
Para profissionais: a paridade de clusters da China em escala pura e organização está erosionando vantagens de custos dos EUA no treinamento em escala de fronteira. Se seu modelo ou aplicação deve executar inferência em escala continental e você tem restrições de residência de dados ou busca reduzir bloqueio de fornecedor com APIs ocidentais, monitore esses clusters chineses para disponibilidade, preços e desempenho. Espere compressão de preços continuada e opção de modelo expandida. Para equipes ocidentais, isso sinaliza um deslocamento acelerado na geografia do treinamento de IA: a era do dominio dominante de código aberto singular dos EUA está cedendo a múltiplos stacks regionais com perfis de custo diferenciados e tradeoffs de soberania.
Fontes
- Primary source
- huaweicentral.com
“China's first 10000 AI card cluster is capable of delivering a computing power of 11000 petaflops”
- the-substrate.net
“Cambricon shipped an estimated 100,000-200,000 Siyuan 590s in 2025 and is targeting roughly 500,000 chips in 2026”
- globaldatacenterhub.com
“China is preparing the conditions to consolidate over 1 million GPUs into centralized AI clusters by 2026”