NVIDIA Spectrum-X Añade MRC para Confiabilidad en IA a Escala Gigantesca
NVIDIA lanzó una actualización a Spectrum-X, su fabric Ethernet nativo para IA abierto, ahora integrado con la tecnología Multipath Reliable Connection (MRC) para tolerancia a fallos a escala.
La mejora aborda un desafío central en redes de clusters de IA a escala gigantesca: confiabilidad bajo cargas masivas de entrenamiento concurrente.