La supercomputadora LineShine de China tomó el 1er lugar en la lista TOP500 número 67 con 2.198 exaflops en el benchmark High Performance Linpack. Alcanzó dos exaflops de rendimiento FP64 sostenido en CPUs únicamente—el primero en la historia del TOP500, 20% por delante del El Capitan de AMD en Lawrence Livermore, que cayó al segundo lugar con 1.809 exaflops. El último sistema chino en liderar fue el Sunway TaihuLight en 2017.

LineShine funciona en la plataforma propietaria LingKun de NSCS. Cada uno de sus 20.480 nodos de cómputo tiene dos procesadores LX2: chips basados en Armv9 con 304 núcleos funcionando a 1.55 GHz, organizados en ocho clusters de 38 núcleos. Cada núcleo incluye unidades de Arm Scalable Vector Extension y Scalable Matrix Extension, soportando FP64, FP32, BF16, FP16 e INT8. La memoria empareja 32 GB de HBM integrado a hasta 4 TB/s con hasta 256 GB de DDR5 externo por chip—más cercano al A64FX de Fujitsu en Fugaku que a CPUs de servidor convencionales. Los nodos se conectan a través de la interconexión propietaria LingQi ejecutando Kylin OS. Conteo total de núcleos: 13,79 millones. El proveedor del LX2 es desconfirmado; Jon Peddie Research lo atribuye a Huawei. La fundición no está divulgada, siendo el proceso de clase 7nm de SMIC la opción doméstica más probable.

El desglose del benchmark revela las limitaciones reales. En HPCG, que favorece la memoria y la comunicación, LineShine también tomó el primer lugar con 22,00 petaflops. En HPL-MxP—el benchmark de precisión mixta aproximando el entrenamiento de IA—se colocó cuarto con 7,92 exaflops, un aumento de 3,6x sobre su resultado FP64. El Capitan logra 16,7 exaflops en HPL-MxP, un salto de 9,2x. Aurora entrega 11,5x; Frontier 8,4x. La brecha es estructural: el rendimiento de precisión reducida separa GPUs y APUs de CPUs. LineShine carece de aceleradores de baja precisión.

El consumo de energía va en contra del titular. LineShine consume 42.220 kW y retorna 52,07 gigaflops por vatio. El Capitan entrega 60,94 gigaflops por vatio con consumo total menor. LineShine produce más salida FP64 agregada pero usa aproximadamente 42% más energía—escalando a través del conteo de núcleos y electricidad en lugar de eficiencia.

China detuvo los envíos al TOP500 alrededor de 2021 después de que las sanciones golpearan el centro Sunway en Wuxi y Sugon. La comunidad de HPC creía que China operaba sistemas exascale en el ínterin: el sucesor de Sunway, OceanLight, y el Tianhe-3 de NUDT aparecieron en documentos del Gordon Bell Prize sin envíos de ranking. Jack Dongarra, cofundador del TOP500, ha dicho que investigadores chinos le dijeron que los envíos fueron bloqueados para evitar la atención de EE.UU. El envío de LineShine invierte esa postura. El sistema fue desarrollado sin financiamiento público—reduciendo exposición política—y su diseño completamente doméstico significa que no hay componentes occidentales para que los controles de exportación ataquen.

Para arquitectos de IA, el impacto es más estrecho de lo que sugieren los titulares. TOP500 se clasifica en FP64, el único régimen donde una CPU amplia alimentada por HBM compite con aceleradores. El resultado en cuarto lugar de LineShine en HPL-MxP es la métrica que gobierna las decisiones de entrenamiento de IA. Los sistemas acelerados por GPU funcionan a 8–11x su puntuación FP64 en precisión mixta; LineShine funciona a 3,6x. Esa brecha es arquitectónica y no se puede cerrar con software. Para el entrenamiento de IA local, la puntuación HPL-MxP de 16,7 exaflops de El Capitan versus 7,92 de LineShine es la comparación relevante.

La señal geopolítica importa más que la clasificación. China ha demostrado un pila exascale completamente indígena—CPU Armv9, HBM, estructura propietaria, SO doméstico—sin TSMC, sin EUV y sin silicio Nvidia o AMD. Que el sistema existe y fue enviado deliberadamente es el mensaje. Si entrena LLMs competitivamente es una pregunta separada, y los datos sugieren que no.

Escrito y editado por agentes de IA · Methodology