Een van de meest over het hoofd geziene elementen door het publiek, het datacenternetwerk, is feitelijk verantwoordelijk voor alle communicatie tussen knooppunten. NVIDIA weet echter dat datacenters met miljoenen GPU's in aantocht zijn, en voor de snelste AI-modellen zullen ze met elkaar verbonden moeten worden, zelfs over meerdere faciliteiten heen. Daarom heeft NVIDIA vandaag Spectrum-XGS Ethernet geïntroduceerd, een uitbreiding van het Spectrum-X-netwerkplatform dat is ontworpen om meerdere geografisch verspreide datacenters met elkaar te verbinden in éénAI-superfabriek.
Het bedrijf zegt dat Spectrum-XGS de capaciteitsbeperkingen van één enkele faciliteit elimineert door afstandsbewuste netwerken te introduceren die voorspelbare prestaties met lage latentie leveren op campussen, steden en continenten.

De technologie wordt voornamelijk geleverd via software- en firmware-updates voor bestaande Spectrum-X-switches en ConnectX SuperNICs, in plaats van via nieuw silicium. Spectrum-XGS biedt zelfinstellende congestiecontrole die is geoptimaliseerd voor langeafstandsverbindingen, nauwkeurig latentiebeheer dat jitter minimaliseert, en uitgebreide end-to-end telemetrie, waardoor operators netwerkverkeer over meerdere locaties kunnen visualiseren en controleren.
NVIDIA meldt dat deze verbeteringen de NCCL-doorvoer (Collective Communication Library) voor trainingstaken met meerdere GPU's, multi-node-trainingen en grootschalige experimenten bijna verdubbelen, waardoor gedistribueerde AI-workloads efficiënter worden. NVIDIA positioneert Spectrum-XGS als een nieuwe groeias voor AI-infrastructuur: na schaalvergroting binnen servers en schaalbaarheid binnen datacenters verbindt schaaloverschrijdende schaalvergroting faciliteiten tot een uniform computerweefsel.

Exploitanten op grote schaal bereiden zich voor op deze aanpak. CoreWeave zal een van de eerste bedrijven zijn die meerdere faciliteiten verbindt met Spectrum-XGS. Het bedrijf zal zijn gedistribueerde locaties gebruiken als een supercomputer, waardoor klanten een grotere totale capaciteit krijgen en de activiteiten worden gestroomlijnd voor experimenten op gigabitschaal en productietrainingen.
Spectrum-XGS is onderdeel van het Spectrum-X-platform en werd gedemonstreerd op de Hot Chips-conferentie. Meer details zullen naar verwachting worden aangekondigd op de Hot Chips-conferentie, maar enorme trainingssessies over het hele continent zijn niet langer een droom. Met oplossingen als Spectrum-XGS is de enige lucht (en het raster) de limiet.