Microsoft heeft onlangs aangekondigd dat zijn eerste batch zelfontwikkelde AI-chips "Maia 200" officieel in gebruik is genomen in een datacenter, en is van plan de wereldwijde implementatie de komende maanden verder uit te breiden. Deze chip is door Microsoft gepositioneerd als een "AI-redeneerkrachtmotor" voor redeneerscenario's, en is voornamelijk geoptimaliseerd voor werklasten op productieniveau met hoge intensiteit, zoals online redeneren op grote schaal. Prestatie-indicatoren vrijgegeven door Microsoft laten zien dat Maia 200 de nieuwste Trainium-chip van Amazon en de nieuwste generatie TPU van Google kan overtreffen in termen van verwerkingssnelheid. Het is bedoeld om de technologische voorsprong te veroveren in de strijd om zelfontwikkelde AI-versnellingschips door cloudfabrikanten.

Een belangrijke achtergrond voor de zelfontwikkelde AI-chips van de cloud computing-gigant zijn de huidige hoge kosten en het krappe aanbod van de nieuwste high-end GPU's van fabrikanten als Nvidia. Dit knelpunt in het aanbod zal op de korte termijn nog steeds moeilijk te verhelpen zijn. Maar zelfs als het zelf ontwikkelde, krachtige AI-chips heeft, zal Microsoft niet stoppen met het kopen van chips van Nvidia en AMD. Microsoft-CEO Satya Nadella zei dat het bedrijf een "geweldig partnerschap" onderhoudt met Nvidia en AMD, en dat beide partijen innovatie op hun respectievelijke terreinen blijven bevorderen. Volgens hem is de marktopinie vaak geïnteresseerd in het vergelijken van "wie er voor ligt", maar de echte sleutel is het behouden van een voorsprong over een lange periode.
Nadella benadrukte ook dat Microsoft het vermogen heeft om verticaal te integreren, maar dit betekent niet dat het bedrijf alleen zijn eigen technologie van top tot teen zal gebruiken en de oplossingen van ecologische partners volledig zal laten varen. Met andere woorden: naast zelfontwikkelde chips zal Microsoft nog steeds vertrouwen op een gediversifieerd hardwareportfolio van leveranciers als Nvidia en AMD om zijn snelgroeiende AI-cloud computing-behoeften te ondersteunen.
Volgens de afspraak van Microsoft krijgt Maia 200 voorrang aan het interne "Superintelligence"-team van het bedrijf. Het team, onder leiding van voormalig medeoprichter van Google DeepMind, Mustafa Suleiman, is verantwoordelijk voor het bouwen van een nieuwe generatie geavanceerde grote modellen voor Microsoft. Algemeen wordt aangenomen dat de investering van Microsoft in het bouwen van eigen geavanceerde modellen erop gericht is om in de toekomst de afhankelijkheid van externe modelleveranciers zoals OpenAI en Anthropic tot op zekere hoogte te verminderen. Suleiman heeft een bericht op het sociale platform geplaatst
Tegelijkertijd ondersteunt Maia 200 ook OpenAI-modellen die draaien op het Microsoft Azure-cloudplatform, waardoor cloudklanten meer AI-rekenkrachtopties krijgen. Uit feedback van alle partijen blijkt echter dat het verkrijgen van de meest geavanceerde AI-hardwarebronnen nog steeds een veelvoorkomend probleem is waarmee de hele sector wordt geconfronteerd. Deze gespannen situatie treft niet alleen betalende klanten, maar ook de interne AI R&D-teams van cloudleveranciers. In een dergelijke aanbodomgeving versnelt Microsoft enerzijds de implementatie van zelfontwikkelde AI-versnellingschips, en anderzijds blijft het de aankopen bij NVIDIA en AMD verhogen om te voldoen aan de dubbele behoeften van zijn AI-infrastructuur in termen van schaaluitbreiding en prestatie-optimalisatie.