Het Vera Rubin-tijdperk van NVIDIA's nieuwe generatie AI-computerplatform is officieel begonnen. Dit staat bekend als het snelste AI-platform ter wereld. Het is geleverd aan een aantal topaanbieders van cloudservices voor testen en verificatie, wat de weg vrijmaakt voor de volgende fase van de implementatie van grote modellen en Agentic AI-trainingen.

Volgens rapporten is het Vera Rubin-platform de fase van massaproductie ingegaan en is de eerste batch complete systemen geleverd aan de computerruimtes van grote AI-cloudleveranciers, waaronder bedrijven als Oracle en CoreWeave. Daarvoor had NVIDIA vorige maand de eerste batch Vera CPU's geleverd aan een aantal toonaangevende AI-bedrijven, waarmee de basis werd gelegd voor de ecologie van dit nieuwe platform.

Mahesh Thiagarajan, executive vice president van Oracle Cloud Infrastructure, publiceerde voor het eerst fysieke foto's van het Vera Rubin NVL72 racksysteem op sociale platforms, waarop dit enorme rackcluster te zien is, bestaande uit 72 Rubin GPU's en 36 Vera CPU's. Door het officieel te positioneren als de huidige top GPU- en CPU-combinatie voor AI-workloads, wil het na Grace Blackwell een nieuw mijlpaalplatform worden in de AI-productlijn van Nvidia.

HKfY-0LaAAAeCwL.jpgHKfY-0ObYAATmc4.jpg

Thiagarajan zei dat Oracle een van de eerste cloudproviders is die het Vera Rubin NVL72-systeem in de cloud introduceert en verificatietests uitvoert. De twee partijen zullen nauw samenwerken om zakelijke klanten te voorzien van een nieuwe generatie versnelde computermogelijkheden in grootschalige cloudomgevingen. Afgaande op de foto's ter plaatse is de NVL72-kast groot van formaat en beschikt hij over complexe bedradings- en koelingsstructuren, wat de ontwerporiëntatie voor ultragrote datacenters benadrukt.

Naast Oracle kondigde cloud computing-bedrijf CoreWeave ook de voltooiing aan van de installatie van het eerste Vera Rubin NVL72-systeem en bracht een complete video uit van de hele machine die van het transportvoertuig naar de computerruimte wordt gelost voor implementatie. Het scherm laat zien dat de installatie van een enkele kast de samenwerking van 3 tot 4 monteurs vereist. Dit weerspiegelt tot op zekere hoogte de specificaties van het systeem op datacenterniveau in termen van volume en gewicht. Het impliceert ook dat soortgelijke kasten in de toekomst in honderden of zelfs duizenden in AI-datacentra kunnen worden ingezet.

CoreWeave benadrukte ook dat het niet alleen een van de eerste cloudserviceproviders was die Vera Rubin NVL72 introduceerde, maar ook de eerste die het gezamenlijk debuggen en verifiëren van de volledige stapel software en hardware voltooide. Voor dit doel heeft het bedrijf zijn eigen softwaregedefinieerde vloeistofkoelsysteem en uniforme kastbesturingsoplossingen gecreëerd, respectievelijk Valvey en Racky genaamd, die worden gebruikt voor het beheer van vloeistofkoeling en uniforme planning van het gehele Vera Rubin-platform van de kast, en via "CoreWeave Mission Control" om operationele monitoring op kastclusterniveau te bereiken.

In de architecturale visie van "AI is een taart met vijf lagen", voorgesteld door NVIDIA-CEO Jensen Huang, is Vera Rubin NVL72 slechts één hardwarelaag. Daarachter vertrouwt het ook op een geavanceerde infrastructuur, waaronder stroomvoorziening, koeling, interconnectie, netwerk, enz., evenals ondersteuning voor de softwarestack die over vele jaren is opgebouwd. Met CUDA en het CUDA-X-ecosysteem voor AI-workloads als kern integreert NVIDIA software en hardware, waardoor het voor concurrerende fabrikanten moeilijk wordt om frontaal te concurreren op het gebied van ecologische volwassenheid en wijdverbreide acceptatie.

In termen van prestaties geven rapporten aan dat in het Mix of Experts (MoE) modeltrainingsscenario het Vera Rubin-platform dezelfde trainingssnelheid kan bereiken als het Blackwell-systeem van de vorige generatie met slechts een kwart van het aantal GPU's, terwijl de kosten per token in de inferentiefase kunnen worden teruggebracht tot een tiende van Blackwell. Dit betekent dat Vera Rubin bij het inzetten van grootschalige modellen en Agentic AI op fabrieksniveau naar verwachting aanzienlijke voordelen zal opleveren op het gebied van rekenvermogensdichtheid en energie-efficiëntie, en belangrijke ondersteuning zal bieden aan cloudleveranciers om de kosten te beheersen en de schaal uit te breiden.

Momenteel is het Vera Rubin-platform in volledige massaproductie gegaan en NVIDIA is van plan om in het derde kwartaal van dit jaar officieel de eerste reeks klantgerichte productietaken te lanceren. Nu toonaangevende cloudserviceproviders zoals Oracle en CoreWeave het voortouw nemen bij het voltooien van de lancering en verificatie, verwacht de industrie over het algemeen dat Vera Rubin binnenkort een van de kerncomponenten zal worden van de nieuwe generatie AI-datacenterinfrastructuur, die de implementatie van ‘Agentic AI-fabrieken’ en complexere grote modelapplicaties zal bevorderen.