In een nieuwe golf van kunstmatige intelligentie, vertegenwoordigd door "Agentic AI", warmt Unified Memory Architecture (UMA) snel op op het gebied van pc's en computers. AMD is van mening dat dit niet alleen een belangrijke kans is, maar ook een belangrijke richting voor de toekomstige productarchitectuur en roadmap.

De zogenaamde unified memory-architectuur verwijst naar het nauw koppelen van de CPU, GPU en het geheugen op dezelfde systeemchip (SoC) om een gedeelde grote geheugenpool te vormen, die door het systeem dynamisch wordt toegewezen tussen de CPU en GPU op basis van de belasting, in plaats van het traditionele scheidingsmodel "systeemgeheugen + onafhankelijk videogeheugen". Bij AI-workloads, vooral bij grote modellen, kan dit ontwerp de knelpunten bij het kopiëren van gegevens en bandbreedte aanzienlijk verminderen, waardoor het langzamerhand een van de mainstream-oplossingen voor AI-terminals en nieuwe vormen van pc's wordt.
Met de lancering van de AMD Ryzen AI MAX-serie en de toevoeging van NVIDIA RTX Spark en andere producten is de uniforme geheugenarchitectuur de gemeenschappelijke technische hoeksteen van AI-terminalplatforms geworden. AMD zei dat hun Ryzen AI MAX-oplossing van de eerste generatie tot 128 GB geheugen kan bieden, waarvan tot 112 GB systeemgeheugen kan worden verdeeld voor de GPU; NVIDIA RTX Spark gebruikt ook een soortgelijk idee om geheugen dynamisch toe te wijzen tussen de CPU en GPU op basis van de werklast, waardoor de uniforme geheugenarchitectuur een breed scala aan toepassingsscenario's kan bestrijken, van algemeen computergebruik tot AI-inferentie.
In een interview met de media werd AMD Vice President David McAfee gevraagd of in de toekomst meer producten UMA-oplossingen zullen gebruiken. Hij antwoordde dat de focus op uniforme geheugensystemen zal blijven toenemen, en dat de industrie "geschikte architecturale vormen" rond dergelijke systemen zal onderzoeken en zal blijven herhalen en verbeteren op basis van bestaande platforms. Hij benadrukte dat dit een nieuw soort werklast en computerruimte is die voor AMD “een hele wereld aan mogelijkheden” zal openen op het gebied van productselectie, routeplanning en implementatievormen.
AMD heeft zijn uniforme geheugendenken uitgebreid naar zijn volgende generatie producten, de Ryzen AI MAX 400-serie. Volgens de officiële introductie kan deze generatie producten tot 192 GB verenigd geheugen ondersteunen en tot 160 GB toewijzen aan de GPU, die kan worden gebruikt om lokaal grote taalmodellen (LLM) uit te voeren met een parameterschaal van meer dan 300 miljard niveaus om te voldoen aan de extreme eisen aan geheugencapaciteit en bandbreedte van complexe AI-workflows en hoogwaardige creatieve workloads.

In de mediarondetafel vroeg een verslaggever verder of het mogelijk is om UMA Ryzen-processors voor games in de toekomst te zien, of een ontwerp vergelijkbaar met "Strix Halo + 3D V-Cache / pakketniveau geheugen met hoge bandbreedte" om de UMA-mogelijkheden verder te verbeteren door nauwere integratie en verpakt geheugen met lagere latentie. McAfee zei dat hij momenteel "geen specifiek antwoord" heeft, maar herhaalde dat platforms zoals Strix Halo hetzelfde pad inslaan als Nvidia, wat betekent dat systeemontwerp rond UMA de komende jaren meer investeringen in middelen en architecturale verkenning zal ontvangen.
Het is vermeldenswaard dat toen McAfee over UMA sprak, hij niet alleen mobiele en AI-terminals noemde, maar ook krachtige desktopsystemen. Hij gelooft dat de voortdurende verbetering van de ondersteuningsmogelijkheden van de unified memory-architectuur en de adoptie van deze architectuur door meer ecologische deelnemers de algehele evolutie van krachtige desktops en unified systeemvormen zullen bevorderen, en het begrip van de industrie over "high-performance pc + unified memory" opnieuw vorm zullen geven. Volgens hem is de uniforme architectuur van platforms als Halo nog steeds de "juiste vorm" van dit type systeem, en de recente gerelateerde releases van Nvidia kunnen worden beschouwd als een "goedkeuring" van dit architecturale pad.
McAfee benadrukte ook dat met de opkomst van Agentic Compute het draaien van ‘zeer grote modellen’ op eindpunten via een uniforme geheugenpool een van de unieke waardeproposities van deze systemen wordt. Voor AMD speelt dit type unified systeem een dubbele rol in het totale productportfolio: aan de ene kant ondersteunt het geavanceerde AI en grote modelworkloads, en aan de andere kant kan het ook de basisplatformvorm worden voor krachtige desktops en geavanceerde creatieve werkstations.
Vanuit het perspectief van de industrie is unified memory-architectuur niet langer een niche-experiment, maar is het snel uitgegroeid tot een basispijler in de nieuwe generatie computerplatforms. Terwijl de vraag van Agentic AI naar gedeelde geheugenpools met grote capaciteit blijft toenemen, hebben fabrikanten zoals AMD en NVIDIA gezamenlijk op UMA ingezet, wat ook betekent dat deze architecturale route sterke steun heeft gekregen van de industrie. AMD's actieve planning voor nieuwe platforms zoals Ryzen AI MAX 400 en zijn open houding ten opzichte van de toekomstige vorm van krachtige platforms zoals Strix Halo laten zien dat dit nog steeds slechts het startpunt is voor de ontwikkeling van unified memory-architectuur.
In een verenigd systeem waarin de grenzen tussen CPU, GPU en geheugen geleidelijk vervagen, wordt verwacht dat het nieuwe generatie platform gelijktijdige sprongen zal maken op het gebied van prestaties, energie-efficiëntie en capaciteitsgrenzen. Dit is niet alleen van toepassing op AI en werklasten van grote modellen, maar kan ook worden uitgebreid naar games en geavanceerde desktopvelden. Voor AMD wordt de uniforme geheugenarchitectuur een van de kernfundamenten in het ontwerp van de volgende generatie productarchitectuur en de routeplanning voor de middellange en lange termijn, en het hele ecosysteem is zojuist de startfase van dit pad ingegaan.