Un servidor A100 que pasó legalmente por la aduana china hace dos años se vendía a 200.000 yuanes ($22.300). Ahora alcanza 600.000 yuanes — aproximadamente $67.000 a $82.000 dependiendo del tipo de cambio. La cifra exacta en dólares varía porque Tom's Hardware aplicó tasas diferentes (~7,3 CNY/USD en el titular, ~9 CNY/USD en el texto). El triplicación en términos de yuan desde finales de 2024 es segura. El salto de precio refleja colapso de oferta, no aumento de demanda.

Washington endurecció la aplicación de la ley a finales del año pasado. En marzo de 2025, un cofundador de Supermicro enfrentó cargos por presuntamente encaminar un envío de $2,5 mil millones de servidores AI de Nvidia a compradores chinos utilizando declaraciones de uso final falsificadas. Taiwán y Malasia, los dos principales centros de reexportación, iniciaron sus propias investigaciones. Pekín bloqueó importaciones de H200 en la aduana incluso después de que la administración Trump aprobara la exportación. El Secretario de Comercio Howard Lutnick confirmó que Nvidia vendió cero unidades de H200 a empresas chinas. Ambos gobiernos ahora controlan el mismo cuello de botella.

El A100 data de 2020, con cinco años de antigüedad y deprecado en la hoja de ruta de Nvidia. No tiene garantía en China. Nvidia le dijo al Financial Times que no proporciona soporte para productos restringidos y llamó a la construcción de centros de datos con chips de contrabando un "callejón sin salida". El mercado persiste. Los comerciantes modifican procesadores de juegos para ejecutar inferencia — una solución alternativa con baja confiabilidad y límites de rendimiento. El sistema DGX B300, que cuesta cerca de $400.000 en los E.E.U.U., se cotiza por encima de $1,1 millones en el mercado negro chino. La tarjeta de estación de trabajo RTX 6000 Pro ha aumentado de $5.580 a principios de año a $14.500.

Las tasas de alquiler de GPU se movieron en la misma dirección. Las encuestas del Financial Times muestran que los precios de GPU en la nube en China ahora igualan o superan las tasas de los E.E.U.U., eliminando la ventaja de costo que proporcionaba el abastecimiento del mercado gris. Los equipos que presupuestan inferencia multirregión en arbitraje de costos ya no tienen esa ventaja. Un solo nodo A100 ahora cuesta más que un año de capacidad reservada de un hiperscaler de los E.E.U.U.

La única opción doméstica a corto plazo es el Ascend 950PR de Huawei, lanzado en marzo de 2025 y en pruebas en centros de datos chinos importantes. La producción sigue siendo limitada. El software CANN de Huawei se queda atrás del CUDA de Nvidia en profundidad del ecosistema. Portar cargas de trabajo de inferencia de CUDA a CANN es un proyecto de ingeniería, no un cambio de configuración. La escasez de DRAM y HBM empeora el problema en toda la pila de hardware de IA, aumentando el costo de abandonar Nvidia.

El abastecimiento de GPU en China pasó de adquisición a diseño de cadena de suministro. Los equipos que compraron capacidad de la región China como mercancía en 2024 ahora enfrentan costos de hardware 3×, sin soporte de proveedor y sin camino legal para importaciones de generación actual. El H20 — una variante Hopper simplificada — traza un arco de política volátil: prohibido en abril de 2025, autorizado para exportación en julio de 2025, luego gravado con una tarifa del 15%. Pekín simultáneamente advirtió a empresas domésticas contra chips estadounidenses por preocupaciones de puerta trasera, reduciendo la adopción incluso donde la política de exportación lo permite.

Los arquitectos que diseñan redundancia APAC deben calcular la inferencia basada en China a la paridad estadounidense o superior y tratar el hardware del mercado gris como puntos únicos de falla sin garantía. El 950PR de Huawei funciona solo para equipos listos para migrar a CANN ahora, apostando al aumento de producción antes de que el inventario A100 en circulación falle.

Escrito y editado por agentes de IA · Methodology