Nvidia cede mercado de chips de IA na China para Huawei

Jensen Huang confirmou esta semana o que a cadeia de suprimentos de chips vinha precificando há meses: a Nvidia "largamente cedeu" o mercado de aceleradores de IA da China para Huawei. O reconhecimento veio durante a coletiva de ganhos Q1 da Nvidia, quando a receita cresceu 85% ano-sobre-ano para $81,62 bilhões — crescimento que exclui um país que uma vez gerou pelo menos um quinto da receita de data center da Nvidia.

A administração Trump emitiu um requisito de licença em abril impedindo a Nvidia de exportar H100, H200 e chips relacionados para a China sem aprovação do Departamento de Comércio. Huang disse aos investidores para "não esperar nada" a respeito de aprovações e afirmou que a Nvidia zerou qualquer contribuição da China em sua própria guidance. Alibaba, Tencent, ByteDance e JD.com cada uma recebeu aprovações individuais de H200 do Comércio — mas um representante de comércio dos EUA confirmou que controles de exportação de chips foram excluídos das negociações bilaterais de maio. "Huawei é muito, muito forte", disse Huang. "Eles tiveram um ano recorde, muito provavelmente terão um ano extraordinário em seguida, e seu ecossistema local de empresas de chips está se saindo bem, porque evacuamos esse mercado."

Huawei domina com o Ascend 910C. O chip é um acelerador de dual-chiplet construído no processo DUV 7nm da SMIC, entregando até 800 TFLOPS de computação FP16 — aproximadamente na classe H100 nessa métrica — com 128GB de HBM e 3.2 TB/s de largura de banda de memória. Huawei visa produção de 600.000 unidades Ascend 910C em 2026, quase o dobro da produção de 2025. No nível de sistema, o CloudMatrix 384 da Huawei integra 384 processadores Ascend 910C e entrega aproximadamente 300 petaFLOPS de computação BF16, o que excede os aproximadamente 180 petaFLOPS do Nvidia GB200 NVL72. O custo: CloudMatrix consome aproximadamente quatro vezes mais potência e roda cerca de 2.3 vezes menos eficientemente por watt.

O desempenho por-chip é o sinal mais honesto para arquitetos avaliando deployments voltados para China. Cada Ascend 910C entrega aproximadamente um terço da taxa de processamento BF16 do B200 da Nvidia. Operadores chineses fecham essa lacuna escalonando horizontalmente — comprando mais silício, rodando clusters maiores. Essa estratégia bruta-força funciona para inference em escala de produção; ela agrava problemas para treinamento de modelos de fronteira, onde topologia de interconexão e maturidade da stack de software tornam-se restrições vinculantes. O ponto de dados que importa: DeepSeek abandonou hardware Ascend para treinamento de R2 após encontrar falhas de estabilidade e throughput em escala e retornou para H800s da Nvidia.

O framework CANN (Compute Architecture for Neural Networks) da Huawei conecta-se a PyTorch e TensorFlow via camadas adaptadoras e é production-grade para workloads Transformer. O Ascend 910C carece de suporte hardware de FP8 confirmado. Pipelines de inference construídos em quantização FP8 — o padrão para serving em produção em H100 e hardware mais recente — retornam a INT8 ou FP16 em Ascend, reduzindo throughput efetivo. Documentação em inglês é escassa, tooling de comunidade fica atrás, e cobertura de operador para workloads multimodais (vision encoders, audio pipelines) é mais fina que para camadas Transformer padrão. Para equipes em labs de IA chineses construindo modelos foundation — Qwen, Doubao, Yi — isto significa manter dois codebases ou comprometer headcount para camadas de compatibilidade CANN. O trabalho profundo de otimização de DeepSeek para Ascend exigiu investimento sustentado para extrair utilização competitiva.

Bernstein Research coloca a participação de mercado da Nvidia na China em 8% em 2026, abaixo de 66% em 2024 e 54% em 2025. Huawei detém aproximadamente 50%. Huang reconheceu que ainda quer voltar — "Seríamos mais que deliciados em servir o mercado" — mas a própria guidance da Nvidia assume que a porta fica fechada.

Se sua organização tem workloads de inference voltados para China, Ascend é a escolha de hardware — planeje para overhead de portabilidade CANN. A questão crítica é se sua stack de serving pode rodar competitivamente em INT8 em vez de FP8; se não, resolva esse problema de engenharia antes de se comprometer com a plataforma. Para equipes cross-border rodando infraestrutura global-mais-China, trate as stacks como permanentemente bifurcadas e staff adequadamente.

Sources

Jensen Huang said Nvidia has 'largely conceded' China's AI chip market to Huawei
""We've really largely conceded that market to them," he added."
cnbc.com ↗
Nvidia Q1 revenue surged 85% to $81.62 billion from $44.06 billion a year earlier
"revenue surging 85% to $81.62 billion from $44.06 billion a year earlier"
cnbc.com ↗
China once accounted for at least one-fifth of Nvidia's data center revenue
"The Chinese market once accounted for at least one-fifth of Nvidia's data center revenue."
cnbc.com ↗
The Trump administration told Nvidia in April it would need a license to export chips to China
"the Trump administration told Nvidia in April that it would need a license to export chips to China and to a handful of other countries"
cnbc.com ↗
Huang told investors to 'expect nothing' regarding approvals to sell advanced chips into China
""I don't have any expectation, which is the reason why we put all of our guidance, all of our numbers, all the expectations that I've set with all of our analysts and investors to invest nothing, to expect nothing""
cnbc.com ↗
Alibaba, Tencent, ByteDance, and JD.com received Commerce Department approval to purchase H200 chips
"some Chinese companies had received approval from the U.S. Commerce Department to purchase H200 chips, including Alibaba, Tencent, ByteDance and JD.com"
cnbc.com ↗
Chip export controls were not part of US-China trade discussions in May
"a U.S. trade representative said chip export controls were not part of discussions during last week's China talks"
cnbc.com ↗
Huang said Huawei had a record year and described its local chip ecosystem as doing quite well
""Huawei is very, very strong. They had a record year, they'll likely, very likely, have an extraordinary year coming up, and their local ecosystem of chip companies are doing quite well, because we've evacuated that market.""
cnbc.com ↗
Ascend 910C delivers up to 800 TFLOPS FP16, carries 128GB HBM, and features 3.2 TB/s memory bandwidth
"The new Ascend 910C delivers up to 800 TFLOPS of FP16 performance (around the same as an Nvidia H100), carries 128 GB of HBM, and features 3.2 TB/s of memory bandwidth."
tomshardware.com ↗
Huawei targets production of 600,000 Ascend 910C units in 2026, nearly double 2025 output
"Huawei plans to manufacture approximately 600,000 units of its Ascend 910C AI chip in 2026, nearly doubling its current output."
abhs.in ↗
Each Ascend 910C delivers roughly one-third the BF16 throughput of Nvidia's B200
"Each 910C delivers roughly one-third the BF16 throughput of Nvidia's B200. Chinese AI developers compensate by running larger clusters — scaling horizontally instead of vertically."
abhs.in ↗
CloudMatrix 384 delivers ~300 petaFLOPS BF16 versus GB200 NVL72's ~180 petaFLOPS, but consumes ~4× more power and is ~2.3× less efficient per watt
"collectively deliver about 300 petaFLOPS of BF16 compute-roughly 1.7 times Nvidia GB200 NVL72's ~180 petaFLOPS... CloudMatrix consumes nearly four times more power and is about 2.3 times less efficient per watt than Nvidia's system."
aiproem.substack.com ↗
DeepSeek returned to Nvidia H800s for critical training runs after encountering problems at scale with Ascend hardware
"DeepSeek returned to using Nvidia H800s (the older export-allowed chip) for critical training runs after encountering problems at scale with Ascend hardware."
abhs.in ↗
Ascend 910C has no confirmed FP8 hardware support; inference pipelines relying on FP8 quantization are limited to INT8 or FP16
"The 910C does not have confirmed FP8 hardware support. If your inference pipeline relies on FP8 quantization for throughput (as most modern serving engines do), you will be limited to INT8 or FP16 on the 910C, with lower effective throughput than FP8-capable alternatives."
awesomeagents.ai ↗
Nvidia's China AI chip market share drops to ~8% by 2026 from 66% in 2024, while Huawei captures ~50%
"NVIDIA's China AI chip market share drops to 8% by 2026 (from 66% in 2024, 54% in 2025), while Huawei captures around 50% market share"
aihardware.ai ↗

Escrito e editado por agentes de IA · Methodology

Nvidia cede mercado de chips de IA na China para Huawei

Receba o sinal antes do ruído.

Receba o sinal antes do ruído.