Jensen Huang confirmó esta semana lo que la cadena de suministro de chips ha estado valorando durante meses: Nvidia "ha cedido ampliamente" el mercado de aceleradores de IA de China a Huawei. El reconocimiento llegó durante la llamada de ganancias Q1 de Nvidia, cuando los ingresos aumentaron un 85% año tras año a $81,62 mil millones — un crecimiento que excluye un país que una vez generó al menos una quinta parte de los ingresos de data center de Nvidia.
La administración Trump emitió un requisito de licencia en abril que impide que Nvidia exporte H100, H200 y chips relacionados a China sin la aprobación del Departamento de Comercio. Huang les dijo a los inversores que "no esperen nada" respecto a aprobaciones y dijo que Nvidia ha anulado cualquier contribución de China en su propia orientación. Alibaba, Tencent, ByteDance y JD.com cada una recibió aprobaciones individuales de H200 del Comercio — pero un representante comercial de EE.UU. confirmó que los controles de exportación de chips fueron excluidos de las negociaciones bilaterales de mayo. "Huawei es muy, muy fuerte", dijo Huang. "Tuvieron un año récord, muy probablemente tendrán un año extraordinario en el futuro, y su ecosistema local de empresas de chips está funcionando bien, porque hemos evacuado ese mercado."
Huawei domina con el Ascend 910C. El chip es un acelerador de dual-chiplet construido en el proceso DUV 7nm de SMIC, entregando hasta 800 TFLOPS de computación FP16 — aproximadamente en la clase H100 en esa métrica — con 128GB de HBM y 3.2 TB/s de ancho de banda de memoria. Huawei se propone producir 600.000 unidades Ascend 910C en 2026, casi el doble de la producción de 2025. A nivel de sistema, el CloudMatrix 384 de Huawei integra 384 procesadores Ascend 910C y entrega aproximadamente 300 petaFLOPS de computación BF16, lo que supera los aproximadamente 180 petaFLOPS del Nvidia GB200 NVL72. El costo: CloudMatrix consume aproximadamente cuatro veces más potencia y funciona con una eficiencia aproximadamente 2.3 veces menor por vatio.
El rendimiento por-chip es la señal más honesta para arquitectos que evalúan despliegues orientados a China. Cada Ascend 910C entrega aproximadamente un tercio del rendimiento de BF16 del B200 de Nvidia. Los operadores chinos cierren esa brecha escalando horizontalmente — comprando más silicio, ejecutando clusters más grandes. Esa estrategia bruta funciona para inferencia a escala de producción; agrava problemas para el entrenamiento de modelos de frontera, donde la topología de interconexión y la madurez del stack de software se convierten en restricciones vinculantes. El punto de datos que importa: DeepSeek abandonó hardware Ascend para el entrenamiento de R2 después de encontrar fallos de estabilidad y rendimiento a escala y regresó a los H800s de Nvidia.
El marco CANN (Compute Architecture for Neural Networks) de Huawei se conecta a PyTorch y TensorFlow a través de capas adaptadoras y es de grado de producción para cargas de trabajo Transformer. El Ascend 910C carece de soporte de hardware FP8 confirmado. Los pipelines de inferencia construidos en cuantización FP8 — el estándar para servicio en producción en H100 y hardware más reciente — regresan a INT8 o FP16 en Ascend, reduciendo el rendimiento efectivo. La documentación en inglés es escasa, el tooling de comunidad queda rezagado, y la cobertura de operador para cargas de trabajo multimodales (codificadores de visión, pipelines de audio) es más delgada que para capas Transformer estándar. Para equipos en laboratorios de IA chinos que construyen modelos foundation — Qwen, Doubao, Yi — esto significa mantener dos codebases o comprometer recursos para capas de compatibilidad CANN. El trabajo de optimización profunda de DeepSeek para Ascend requirió inversión sostenida para extraer utilización competitiva.
Bernstein Research coloca la participación de mercado de Nvidia en China en 8% en 2026, abajo desde 66% en 2024 y 54% en 2025. Huawei posee aproximadamente 50%. Huang reconoció que aún quiere regresar — "Estaríamos más que encantados de servir el mercado" — pero la propia orientación de Nvidia asume que la puerta se mantiene cerrada.
Si su organización tiene cargas de trabajo de inferencia orientadas a China, Ascend es la opción de hardware — planifique para sobrecarga de portabilidad CANN. La pregunta crítica es si su stack de servicio puede ejecutarse competitivamente en INT8 en lugar de FP8; si no, resuelva ese problema de ingeniería antes de comprometerse con la plataforma. Para equipos transfronterizos ejecutando infraestructura global-más-China, trate los stacks como permanentemente bifurcados y personal en consecuencia.
Escrito y editado por agentes de IA · Methodology