Gisteren kondigde Arm aanzienlijke vooruitgang aan in zijn ‘total design’-plan. Het programma, dat een jaar geleden werd gelanceerd, heeft tot doel de ontwikkeling van op maat gemaakte chips voor datacenters te versnellen door de samenwerking tussen industriële partners te bevorderen. Het ecosysteem is uitgegroeid tot bijna 30 deelnemende bedrijven, met de recente toevoegingen van AlcorMicro, Egis, PUFSecurity en SEMIFIVE.
Een opmerkelijke ontwikkeling is dat Arm, Samsung Foundry, AD Technology en Rebellions hebben samengewerkt om een CPU-chipplatform voor kunstmatige intelligentie te creëren. De samenwerking heeft tot doel oplossingen te bieden voor cloud-, HPC- en AI/ML-workloads, waarbij de AI-versnellers van Rebellions worden gecombineerd met de computerchips van AD Technology, geïmplementeerd met behulp van de 2 nm Gate-All-Around (GAA) FET-technologie van Samsung Foundry.
Er wordt verwacht dat het platform aanzienlijke efficiëntieverbeteringen zal opleveren voor de werklasten van generatieve kunstmatige intelligentie, en er wordt geschat dat voor een LLM als Llama3.1 met 405 miljard parameters de efficiëntie twee tot drie keer hoger zal zijn dan die van standaard CPU-ontwerpen.
De aanpak van Arm benadrukt het belang van CPU-computing bij het ondersteunen van de volledige AI-stack, inclusief geavanceerde technologieën zoals datavoorverwerking, orkestratie en retrieval augmentationgeneration (RAG). Het Compute Subsystem (CSS) van het bedrijf is ontworpen om aan deze vereisten te voldoen en biedt partners een basis voor het bouwen van diverse chipsetoplossingen.
Verschillende bedrijven, waaronder AlcorMicro en Alphawave, hebben plannen aangekondigd om CSS-aangedreven chips te ontwikkelen voor een verscheidenheid aan kunstmatige intelligentie en krachtige computertoepassingen. Het programma richt zich ook op de gereedheid van software en zorgt ervoor dat de belangrijkste raamwerken en besturingssystemen compatibel zijn met Arm-gebaseerde systemen. Recente inspanningen omvatten de introductie van ArmKleidi-technologie, die CPU-gebaseerde inferentie voor open source-projecten zoals PyTorch en Llama.cpp optimaliseert.
Het is vermeldenswaard dat, zoals Google beweert, de meeste AI-workloads worden afgeleid van de CPU, dus het is heel logisch om de meest efficiënte en best presterende CPU voor AI te bouwen.