Supercomputador LineShine da China lidera TOP500 com 2.198 exaflops apenas com CPU, encerrando reinado de El Capitan dos EUA
O supercomputador LineShine da China assumiu o topo da lista TOP500 com 2.198 exaflops de desempenho Linpack de precisão dupla, empurrando El Capitan powered by AMD (1.809 exaflops) para o segundo lugar. Criticamente, LineShine alcançou isso sem usar nenhuma GPU ou aceleradores de nenhum tipo—apenas 13,78 milhões de núlcleos de silício domesticamente projetado baseado em Armv9 (processador LX2), a primeira máquina apenas com CPU a ultrapassar o limite de dois exaflops. O sistema usa processo doméstico de 7nm da SMIC, interconexões LingQi proprietárias e o SO Kylin, representando uma pilha de tecnologia completamente doméstica.
Este é o primeiro sistema baseado na China a liderar o TOP500 desde Sunway TaihuLight em 2017. Mais revelador, a China parou de enviar suas máquinas mais rápidas para a lista por volta de 2021 após sanções de lista de entidades; a decisão de enviar LineShine agora sinaliza uma mudança de postura geopoliticamente deliberada. Observadores acreditam que a China operou sistemas exascale não divulgados (OceanLight, Tianhe-3) por anos sem enviar. A divulgação de LineShine é uma afirmação de que design e fabricação indigentes podem funcionar sem componentes ocidentais, quebrando dependência em TSMC, EDA e controles de exportação.
No entanto, LineShine domina apenas em cargas de trabalho FP64 de alta precisão. No benchmark HPL-MxP de precisão mista que aproxima a matemática de treinamento de IA, ele pontuou apenas 22% do ganho de desempenho relativo de El Capitan, classificando-se em quarto lugar com 7,92 exaflops versus 16,7 exaflops de El Capitan. LineShine também consome 42.220 kW (puxando 42% mais energia do que El Capitan para saída FP64 de magnitude similar), indicando que a arquitetura favorece HPC tradicional sobre matemática de matriz em escala de IA.
Para equipes de infraestrutura: LineShine prova que a China pode construir sistemas exascale soberanos, mas levanta questões sobre cargas de trabalho de IA de fronteira. A discrepancia entre desempenho FP64 e FP32/BF16 destaca por que GPUs e aceleradores especializados ainda reinam treinamento e inferência. Isso é menos uma ameaça ao domínio de IA da NVIDIA do que uma afirmação sobre independência de HPC. Observe se os próximos sistemas da China priorizam desempenho de precisão reduzida e se evasão de sanções via silício customizado torna-se alicerce para outros jogadores de fronteira.