Het Britse chipontwerpbedrijf Arm heeft onlangs de lancering aangekondigd van een nieuwe Arm AGI CPU, die voor het eerst de datacentermarkt betreedt als zijn eigen in massa geproduceerde chip, gericht op opkomende 'agent'-werklasten op het gebied van kunstmatige intelligentie. Dit markeert een grote verschuiving in het bedrijfsmodel van dit bedrijf dat lange tijd gericht was op het licentiëren van IP. Al meer dan drie decennia levert Arm alleen architectuur en kernontwerp, die door partners worden vervaardigd. Nu neemt het met zijn AGI CPU-serie rechtstreeks deel aan de frontlinieconcurrentie van krachtige datacenterprocessors.

Volgens rapporten is de Arm AGI CPU gebouwd op basis van 3 nm-procestechnologie. Eén enkele chip integreert tot 136 Neoverse V3-kernen. Het thermische ontwerpvermogen van de gehele kaart bedraagt 300 W. Elke kern kan een geheugenbandbreedte van 6 GB/s verkrijgen en de toegangsvertraging binnen 100 ns regelen. Het ondersteunt één enkele chip met een maximale geheugencapaciteit van 6 TB en is compatibel met DDR5-8800-specificaties. Op het gebied van I/O biedt de processor 96 PCIe Gen 6-lanes en integreert CXL 3.0- en AMBA CHI-verbindingen (Coherent Hub Interface) om collaboratieve computervereisten met hoge bandbreedte en lage latentie te ondersteunen. Elke kern kan onafhankelijk een programmathread afhandelen. Arm zei dat dit ontwerp helpt voorkomen dat threads overvol zijn of lange tijd inactief zijn in scenario's met aanhoudende hoge belasting, en dat het algehele gebruik van hulpbronnen wordt verbeterd.

In termen van rekenvermogensdichtheid, wat van groot belang is voor datacenters, laten cijfers van Arm zien dat onder een luchtkoelingssysteem een enkel rack tot 8.160 cores kan inzetten, terwijl het gebruik van vloeistofkoelingsoplossingen dit aantal kan verhogen tot meer dan 45.000. Arm voorspelt dat om aan de toekomstige AI-ontwikkelingsbehoeften te voldoen, de CPU-rekenkracht die nodig is per gigawatt vermogen in datacenters ruim vier keer hoger zal zijn dan het huidige niveau. Het is van mening dat de traditionele x86-architectuur te veel overhead en complexiteit heeft in deze nieuwe werklast, wat niet bevorderlijk is voor verdere verbeteringen in prestaties en energie-efficiëntie. Uit officiële vergelijkende gegevens blijkt dat de Arm-oplossing meer dan tweemaal de prestaties van x86 kan bereiken in termen van prestaties per rack, en het potentieel heeft om tot $10 miljard aan kostenbesparingen per gigawatt aan AI-computerkracht in het datacenter te realiseren.

Op ecologisch en implementatieniveau is Meta de kernpartner en belangrijkste exploitant van deze AGI CPU. Het zal de processor combineren met zijn zelfontwikkelde MTIA-accelerator voor grootschalige AI-planning en orkestratie op zijn platform. Naast Meta hebben veel bedrijven, waaronder OpenAI, Cloudflare, Cerebras, Rebellions, SAP en SK Telecom, hun adoptie van dit platform bevestigd. Op hardwaregebied lanceren fabrikanten als ASRock Rack, Lenovo, Quanta en Supermicro serverproducten op basis van dit platform. De eerste batch systemen is aan een aantal klanten geleverd en zal naar verwachting in de tweede helft van dit jaar op grotere schaal beschikbaar zijn.
Arm zei dat er meer dan 50 ecologische partners achter dit product zitten, waaronder clouddiensten, chipfabrikanten en opslagfabrikanten zoals AWS, Google, Microsoft, NVIDIA, Samsung, TSMC en Micron, die een complete keten vormen die ontwerp, productie, hardwaresystemen en cloudimplementatie omvat. Voor Arm is de lancering van AGI CPU niet alleen een technische lay-out, maar betekent het ook dat zijn rol zich uitstrekt van "architectuuraanbieder" tot "aanbieder van complete oplossingen", die strijdt om een hogere stem in de nieuwe ronde van AI-datacenterinfrastructuurcompetitie.