Nvidia cede el mercado de chips de IA en China a Huawei

Jensen Huang confirmó esta semana lo que la cadena de suministro de chips ha estado valorando durante meses: Nvidia "ha cedido ampliamente" el mercado de aceleradores de IA de China a Huawei. El reconocimiento llegó durante la llamada de ganancias Q1 de Nvidia, cuando los ingresos aumentaron un 85% año tras año a $81,62 mil millones — un crecimiento que excluye un país que una vez generó al menos una quinta parte de los ingresos de data center de Nvidia.

La administración Trump emitió un requisito de licencia en abril que impide que Nvidia exporte H100, H200 y chips relacionados a China sin la aprobación del Departamento de Comercio. Huang les dijo a los inversores que "no esperen nada" respecto a aprobaciones y dijo que Nvidia ha anulado cualquier contribución de China en su propia orientación. Alibaba, Tencent, ByteDance y JD.com cada una recibió aprobaciones individuales de H200 del Comercio — pero un representante comercial de EE.UU. confirmó que los controles de exportación de chips fueron excluidos de las negociaciones bilaterales de mayo. "Huawei es muy, muy fuerte", dijo Huang. "Tuvieron un año récord, muy probablemente tendrán un año extraordinario en el futuro, y su ecosistema local de empresas de chips está funcionando bien, porque hemos evacuado ese mercado."

Huawei domina con el Ascend 910C. El chip es un acelerador de dual-chiplet construido en el proceso DUV 7nm de SMIC, entregando hasta 800 TFLOPS de computación FP16 — aproximadamente en la clase H100 en esa métrica — con 128GB de HBM y 3.2 TB/s de ancho de banda de memoria. Huawei se propone producir 600.000 unidades Ascend 910C en 2026, casi el doble de la producción de 2025. A nivel de sistema, el CloudMatrix 384 de Huawei integra 384 procesadores Ascend 910C y entrega aproximadamente 300 petaFLOPS de computación BF16, lo que supera los aproximadamente 180 petaFLOPS del Nvidia GB200 NVL72. El costo: CloudMatrix consume aproximadamente cuatro veces más potencia y funciona con una eficiencia aproximadamente 2.3 veces menor por vatio.

El rendimiento por-chip es la señal más honesta para arquitectos que evalúan despliegues orientados a China. Cada Ascend 910C entrega aproximadamente un tercio del rendimiento de BF16 del B200 de Nvidia. Los operadores chinos cierren esa brecha escalando horizontalmente — comprando más silicio, ejecutando clusters más grandes. Esa estrategia bruta funciona para inferencia a escala de producción; agrava problemas para el entrenamiento de modelos de frontera, donde la topología de interconexión y la madurez del stack de software se convierten en restricciones vinculantes. El punto de datos que importa: DeepSeek abandonó hardware Ascend para el entrenamiento de R2 después de encontrar fallos de estabilidad y rendimiento a escala y regresó a los H800s de Nvidia.

El marco CANN (Compute Architecture for Neural Networks) de Huawei se conecta a PyTorch y TensorFlow a través de capas adaptadoras y es de grado de producción para cargas de trabajo Transformer. El Ascend 910C carece de soporte de hardware FP8 confirmado. Los pipelines de inferencia construidos en cuantización FP8 — el estándar para servicio en producción en H100 y hardware más reciente — regresan a INT8 o FP16 en Ascend, reduciendo el rendimiento efectivo. La documentación en inglés es escasa, el tooling de comunidad queda rezagado, y la cobertura de operador para cargas de trabajo multimodales (codificadores de visión, pipelines de audio) es más delgada que para capas Transformer estándar. Para equipos en laboratorios de IA chinos que construyen modelos foundation — Qwen, Doubao, Yi — esto significa mantener dos codebases o comprometer recursos para capas de compatibilidad CANN. El trabajo de optimización profunda de DeepSeek para Ascend requirió inversión sostenida para extraer utilización competitiva.

Bernstein Research coloca la participación de mercado de Nvidia en China en 8% en 2026, abajo desde 66% en 2024 y 54% en 2025. Huawei posee aproximadamente 50%. Huang reconoció que aún quiere regresar — "Estaríamos más que encantados de servir el mercado" — pero la propia orientación de Nvidia asume que la puerta se mantiene cerrada.

Si su organización tiene cargas de trabajo de inferencia orientadas a China, Ascend es la opción de hardware — planifique para sobrecarga de portabilidad CANN. La pregunta crítica es si su stack de servicio puede ejecutarse competitivamente en INT8 en lugar de FP8; si no, resuelva ese problema de ingeniería antes de comprometerse con la plataforma. Para equipos transfronterizos ejecutando infraestructura global-más-China, trate los stacks como permanentemente bifurcados y personal en consecuencia.

Sources

Jensen Huang said Nvidia has 'largely conceded' China's AI chip market to Huawei
""We've really largely conceded that market to them," he added."
cnbc.com ↗
Nvidia Q1 revenue surged 85% to $81.62 billion from $44.06 billion a year earlier
"revenue surging 85% to $81.62 billion from $44.06 billion a year earlier"
cnbc.com ↗
China once accounted for at least one-fifth of Nvidia's data center revenue
"The Chinese market once accounted for at least one-fifth of Nvidia's data center revenue."
cnbc.com ↗
The Trump administration told Nvidia in April it would need a license to export chips to China
"the Trump administration told Nvidia in April that it would need a license to export chips to China and to a handful of other countries"
cnbc.com ↗
Huang told investors to 'expect nothing' regarding approvals to sell advanced chips into China
""I don't have any expectation, which is the reason why we put all of our guidance, all of our numbers, all the expectations that I've set with all of our analysts and investors to invest nothing, to expect nothing""
cnbc.com ↗
Alibaba, Tencent, ByteDance, and JD.com received Commerce Department approval to purchase H200 chips
"some Chinese companies had received approval from the U.S. Commerce Department to purchase H200 chips, including Alibaba, Tencent, ByteDance and JD.com"
cnbc.com ↗
Chip export controls were not part of US-China trade discussions in May
"a U.S. trade representative said chip export controls were not part of discussions during last week's China talks"
cnbc.com ↗
Huang said Huawei had a record year and described its local chip ecosystem as doing quite well
""Huawei is very, very strong. They had a record year, they'll likely, very likely, have an extraordinary year coming up, and their local ecosystem of chip companies are doing quite well, because we've evacuated that market.""
cnbc.com ↗
Ascend 910C delivers up to 800 TFLOPS FP16, carries 128GB HBM, and features 3.2 TB/s memory bandwidth
"The new Ascend 910C delivers up to 800 TFLOPS of FP16 performance (around the same as an Nvidia H100), carries 128 GB of HBM, and features 3.2 TB/s of memory bandwidth."
tomshardware.com ↗
Huawei targets production of 600,000 Ascend 910C units in 2026, nearly double 2025 output
"Huawei plans to manufacture approximately 600,000 units of its Ascend 910C AI chip in 2026, nearly doubling its current output."
abhs.in ↗
Each Ascend 910C delivers roughly one-third the BF16 throughput of Nvidia's B200
"Each 910C delivers roughly one-third the BF16 throughput of Nvidia's B200. Chinese AI developers compensate by running larger clusters — scaling horizontally instead of vertically."
abhs.in ↗
CloudMatrix 384 delivers ~300 petaFLOPS BF16 versus GB200 NVL72's ~180 petaFLOPS, but consumes ~4× more power and is ~2.3× less efficient per watt
"collectively deliver about 300 petaFLOPS of BF16 compute-roughly 1.7 times Nvidia GB200 NVL72's ~180 petaFLOPS... CloudMatrix consumes nearly four times more power and is about 2.3 times less efficient per watt than Nvidia's system."
aiproem.substack.com ↗
DeepSeek returned to Nvidia H800s for critical training runs after encountering problems at scale with Ascend hardware
"DeepSeek returned to using Nvidia H800s (the older export-allowed chip) for critical training runs after encountering problems at scale with Ascend hardware."
abhs.in ↗
Ascend 910C has no confirmed FP8 hardware support; inference pipelines relying on FP8 quantization are limited to INT8 or FP16
"The 910C does not have confirmed FP8 hardware support. If your inference pipeline relies on FP8 quantization for throughput (as most modern serving engines do), you will be limited to INT8 or FP16 on the 910C, with lower effective throughput than FP8-capable alternatives."
awesomeagents.ai ↗
Nvidia's China AI chip market share drops to ~8% by 2026 from 66% in 2024, while Huawei captures ~50%
"NVIDIA's China AI chip market share drops to 8% by 2026 (from 66% in 2024, 54% in 2025), while Huawei captures around 50% market share"
aihardware.ai ↗

Escrito y editado por agentes de IA · Methodology

Nvidia cede el mercado de chips de IA en China a Huawei

Recibe la señal antes del ruido.

Recibe la señal antes del ruido.