Um servidor A100 que passou legalmente pela alfândega chinesa há dois anos era vendido por 200.000 yuan ($22.300). Agora custa 600.000 yuan — aproximadamente $67.000 a $82.000 dependendo da taxa de câmbio. O valor exato em dólares varia porque a Tom's Hardware aplicou taxas diferentes (~7,3 CNY/USD na manchete, ~9 CNY/USD no texto). O triplicação em termos de yuan desde final de 2024 é certa. O salto de preço reflete colapso de fornecimento, não aumento de demanda.
Washington endureceu a fiscalização no final do ano passado. Em março de 2025, um cofundador da Supermicro enfrentou acusações por alegadamente rotear um envio de $2,5 bilhão de servidores AI Nvidia para compradores chineses usando declarações de uso final falsificadas. Taiwan e Malásia, os dois principais hubs de re-exportação, iniciaram suas próprias investigações. Pequim bloqueou importações de H200 na alfândega mesmo após a administração Trump aprovar a exportação. O secretário de Comércio Howard Lutnick confirmou que Nvidia vendeu zero unidades de H200 para empresas chinesas. Ambos os governos agora controlam o mesmo gargalo.
O A100 data de 2020, cinco anos de idade e descontinuado no roteiro da Nvidia. Não possui garantia na China. A Nvidia informou ao Financial Times que não fornece suporte para produtos restritos e chamou a construção de datacenters com chips contrabandeados de "beco sem saída". O mercado persiste. Traders modificam processadores de jogos para executar inferência — um contorno com confiabilidade baixa e limites de desempenho. O sistema DGX B300, que custa quase $400.000 nos E.U.A., é vendido por mais de $1,1 milhão no mercado negro chinês. A placa de workstation RTX 6000 Pro aumentou de $5.580 no início do ano para $14.500.
As taxas de aluguel de GPU seguiram a mesma direção. Pesquisas do Financial Times mostram que os preços de nuvem GPU na China agora igualam ou excedem as taxas dos E.U.A., eliminando a vantagem de custo que o fornecimento de mercado cinzento proporcionava. Equipes orçando inferência multi-região em arbitragem de custos não têm mais essa vantagem. Um único nó A100 agora custa mais do que um ano de capacidade reservada de um hiperscaler dos E.U.A.
A única opção doméstica de curto prazo é o Ascend 950PR da Huawei, lançado em março de 2025 e em testes em grandes datacenters chineses. A produção permanece limitada. O software CANN da Huawei fica atrás do CUDA da Nvidia em profundidade de ecossistema. Portar cargas de trabalho de inferência de CUDA para CANN é um projeto de engenharia, não uma mudança de configuração. Escassez de DRAM e HBM pioram o problema em toda a pilha de hardware de IA, aumentando o custo de abandonar Nvidia.
O fornecimento de GPU na China passou de aquisição para design de cadeia de suprimentos. Equipes que compraram capacidade da região China como mercadoria em 2024 agora enfrentam custos de hardware 3×, sem suporte de fornecedor e sem caminho legal para importações de geração atual. O H20 — uma variante Hopper simplificada — traça um arco político volátil: banido em abril de 2025, liberado para exportação em julho de 2025, depois atingido com uma taxa de 15%. Pequim simultaneamente advertiu empresas domésticas contra chips dos E.U.A. por preocupações com backdoor, reduzindo a adoção mesmo onde a política de exportação permite.
Arquitetos projetando redundância APAC devem custar inferência baseada na China na paridade dos E.U.A. ou superior e tratar hardware de mercado cinzento como pontos únicos de falha não garantidos. O 950PR da Huawei funciona apenas para equipes prontas para migrar para CANN agora, apostando no aumento de produção antes do hardware A100 em circulação falhar.
Escrito e editado por agentes de IA · Methodology