Terwijl de golf van kunstmatige intelligentie de vraag naar elektriciteit in datacenters doet stijgen, heeft een onderzoeksteam van de Universiteit van Illinois in Urbana-Champaign een nieuwe driedimensionaal geprinte puur koperen koelplaattechnologie ontwikkeld, die naar verwachting het energieverbruik van datacenters voor koeling aanzienlijk zal verminderen van ongeveer 30% van het huidige totale energieverbruik naar ongeveer 1,1%. Onderzoekers schatten dat als deze technologie volledig wordt toegepast in ultragrootschalige datacenters, het totale koelingsgerelateerde energieverbruik naar verwachting met meer dan 90% zal worden verminderd, waardoor de efficiëntielimiet wordt benaderd die met de huidige thermische techniek kan worden bereikt.

Volgens het Internationaal Energieagentschap zal het mondiale elektriciteitsverbruik van datacenters in 2025 485 terawattuur bereiken, waarvan ongeveer 30% – een waarde die al hoger is dan het jaarlijkse elektriciteitsverbruik van Zweden – wordt gebruikt voor de koelfaciliteiten zelf. Tegelijkertijd heeft de snelle ontwikkeling van generatieve kunstmatige intelligentie ertoe geleid dat de industrie zelfs overweegt datacenters in de ruimte te bouwen om een directere voorziening van zonne-energie te verkrijgen. Wat zelfs nog ironischer is, is dat ongeveer een derde van deze enorme stroomuitgaven niets te maken heeft met de computer zelf, maar wordt gebruikt om de elektrische energie die door de chips in warmte wordt omgezet, te 'wegvoeren'.
Als we de GB200-chip van Nvidia als voorbeeld nemen, bedraagt het energieverbruik van een enkele chip 1.200 watt, en het dagelijkse energieverbruik bedraagt ongeveer 28,8 kilowattuur, wat dichtbij het gemiddelde dagelijkse energieverbruik van een gemiddeld Amerikaans huishouden ligt. Door het onvermijdelijke Joule-verwarmingseffect worden deze 1200 watt vrijwel gelijk omgezet in verwarmingsvermogen, wat theoretisch genoeg is om in slechts één uur meer dan 50 glazen water te verwarmen. Als duizenden, of zelfs honderdduizenden, van deze chips dicht in racks worden gestapeld zoals nu, zonder enige koeling, zijn de 220.000 GPU's en 300 megawatt aan vermogen in xAI's Colossus 1-datacenter alleen al voldoende om ongeveer 785.000 vierkante meter ruimte in één uur te verwarmen tot ongeveer 1.200 graden Celsius, wat heter is dan magma. Het is duidelijk dat koeling een onvermijdelijke en zelfs levensbedreigende schakel is geworden in de werking van datacenters.
Behnood Bazmi, de eerste auteur van het artikel en werktuigbouwkundig ingenieur, merkte op: "Koeling is het knelpunt van het huidige chipontwerp. Door de kloof tussen computerontwerp en productiemogelijkheden te overbruggen, biedt onze oplossing een nieuw pad voor vloeistofkoeling van energiezuinigere chips en diverse elektronische apparatuur." Datacenters hebben lange tijd vooral vertrouwd op luchtkoeling: het installeren van metalen koellichamen op CPU's en GPU's, het uitbreiden van het warmtewisselingsgebied door middel van dunne vinnen en het aanvullen met geforceerde convectie door krachtige ventilatoren. Om een enorm luchtbehandelingssysteem aan te drijven, verbruikt deze methode zelf veel stroom, en in het licht van de sterk toenemende warmtestroomdichtheid van de nieuwe generatie AI-acceleratorchips wordt traditionele luchtkoeling steeds ontoereikend.
Daarom versnelt de industrie de verschuiving naar directe vloeistofkoelingoplossingen voor chips, dat wil zeggen het installeren van een metalen "koude plaat" boven de processor, die de koelvloeistofstroom door de interne kleine kanaaltjes leidt en de chipwarmte snel afvoert. Conventionele koudeplaten op de markt zijn al lang in gebruik, maar het ontwerp van hun interne vinnen en stroomkanalen geeft over het algemeen prioriteit aan verwerkingsgemak. De geometrische vormen zijn meestal rechthoekig of cilindrisch en de materialen zijn meestal gemaakt van aluminiumlegering of roestvrij staal. Het is moeilijk om een balans te vinden tussen de ultieme warmte-uitwisselingsprestaties en de controle van de stromingsweerstand.
De innovatie van het team van de Universiteit van Illinois concentreert zich op de twee belangrijkste aspecten: materiaal en vinstructuur. De onderzoekers gebruikten topologie-optimalisatiemethoden en introduceerden wiskundige optimalisatie-algoritmen om de interne microstructuur van de koude plaat opnieuw te ontwerpen, evoluerend van de traditionele vierkante kolom en cilindrische geometrie naar een meer complexe, gekartelde en scherpe driedimensionale vorm om het warmteoverdrachtsgebied en de thermische prestaties te maximaliseren, rekening houdend met de weerstand van het stromingskanaal. Omdat deze zeer complexe structuren vrijwel onmogelijk economisch te verwerken zijn via traditionele processen, heeft het team zich tot geavanceerde elektrochemische additieve productie (ECAM) gewend om de gewenste vorm laag voor laag rechtstreeks te genereren. Wat de materiaalkeuze betreft, hebben ze stoutmoedig gebruik gemaakt van puur koper, dat een uitstekende thermische geleidbaarheid heeft, maar uiterst moeilijk fijn te vormen is bij conventioneel 3D-printen.
Volgens werktuigbouwkundig ingenieur Nenad Miljkovic, corresponderend auteur van het artikel, kan ECAM-technologie puur koper verwerken tot fijne kenmerken zo fijn als 30 tot 50 micron, wat zelfs kleiner is dan de diameter van een mensenhaar. Experimentele resultaten tonen aan dat deze topologie-geoptimaliseerde koude plaat, gemaakt van puur koper, in vergelijking met commerciële conventionele koude platen de koelprestaties tot ongeveer 32% kan verbeteren onder vloeistofkoelingsomstandigheden, terwijl de drukval van het systeem tot 68% wordt verminderd. De afname van de drukval betekent dat het pompvermogen dat nodig is om de koelvloeistofcirculatie per tijdseenheid te bevorderen, aanzienlijk wordt verminderd. De combinatie van deze twee levert een aanzienlijke besparing op het totale energieverbruik op.
Het onderzoeksteam voerde verder modelanalyses uit vanaf het algemene niveau van het datacenter. In het huidige scenario waarin luchtkoeling nog steeds domineert, kan een datacenter met een geïnstalleerd vermogen van 1 GW alleen al voor de koeling van de infrastructuur ongeveer 550 MW aan extra stroom nodig hebben. Na toepassing van de geoptimaliseerde oplossing voor vloeistofkoeling die zij hebben voorgesteld, zal het energieverbruik voor koeling van een faciliteit van dezelfde omvang naar verwachting worden teruggebracht tot ongeveer 11 megawatt. Met andere woorden: terwijl de effectieve warmteafvoer van de extreme hitte die door grootschalige AI-hardware wordt gegenereerd behouden blijft, wordt verwacht dat het energieverbruik van de koeling zal worden gecomprimeerd van de huidige ongeveer 30% naar 35% naar ongeveer 1,1%, een totale reductie van meer dan 95%.
Als deze modelvoorspellingen kunnen worden gereproduceerd in echte hyperscale-implementaties, zal de impact op de energie-efficiëntie van datacenters revolutionair zijn. Volgens de inschatting van het onderzoeksteam kan dit systeem het datacenter helpen een energiegebruiksefficiëntie (PUE) van ongeveer 1,011 te bereiken, wat betekent dat bijna elke watt aan stroominvoer van het elektriciteitsnet rechtstreeks wordt gebruikt voor computergebruik, in plaats van te worden verbruikt voor aanvullende middelen zoals koeling, transmissie- en distributieverliezen of verlichting. Ter vergelijking: de meeste van 's werelds meest geavanceerde PUE's voor ultragrote datacenters liggen tussen 1,1 en 1,3, terwijl de theoretische "perfecte" PUE voor datacenters 1,0 is. Dat wil zeggen dat er geen energie wordt verspild aan koeling en ondersteunende infrastructuur.
Uiteraard gaf het onderzoeksteam ook toe dat de huidige cijfers over het energieverbruik van het gehele datacenter zich nog in de modelaftrekfase bevinden en niet gebaseerd zijn op meetresultaten ter plaatse van echte datacenters op gigawattniveau. Maar toch, als de technologie de prestaties bij grootschalige implementaties zoals verwacht kan handhaven, heeft deze het potentieel om een van de grootste over het hoofd geziene verborgen energieverbruik achter de huidige AI-hausse aanzienlijk te verminderen: de koeling van datacenters. Onderzoekers zijn van mening dat dit idee van het combineren van ontwerpoptimalisatie met geavanceerde productieprocessen niet beperkt is tot datacenters, maar ook kan worden uitgebreid naar een breder scala aan elektronische apparatuur en zelfs andere technische gebieden die efficiënt thermisch beheer vereisen.