Google reduceert de Gemini-computerstroomvoorziening naar Meta

Volgens de Financial Times heeft Google Meta rond maart van dit jaar gewaarschuwd dat het niet langer kon voldoen aan de grootschalige rekenkracht- en capaciteitsbehoeften voor het Gemini-model, waardoor de sociale gigant gedwongen werd het gebruik ervan te verminderen en meerdere interne AI-projecten uit te stellen. Relevante beperkingen zijn nog steeds aan de gang. Meta heeft interne medewerkers gevraagd om het verbruik van AI-tokens ‘nauwlettend in de gaten te houden’ en een meer ingetogen benadering te gebruiken om modelinputs, outputs en algemeen gebruik te noemen. Dit staat in schril contrast met de houding van het bedrijf om het gebruik van AI het afgelopen jaar in bepaalde scenario's intern krachtig te promoten en zelfs te "verplichten".

Het rapport wees erop dat, hoewel Meta de afgelopen jaren zwaar heeft geïnvesteerd in het bouwen van zijn eigen Llama open source-model, en CEO Mark Zuckerberg voortdurend heeft verklaard dat AI het kernplatform van de volgende generatie van het bedrijf zal worden, Meta in veel belangrijke zakelijke relaties in feite sterk afhankelijk is van Google's Gemini. Volgens mensen die bekend zijn met de kwestie, gebruikt Meta Gemini op grote schaal in scenario's zoals klantenservice, chatbots voor adverteerders, het genereren van code, het verwijderen van verdachte of schadelijke inhoud en fraudedetectie, en werd het geselecteerd als de interne voorkeursoplossing, juist omdat de prestaties ervan beter zijn dan Meta's eigen model; Tegelijkertijd concurreert Claude van Anthropic ook en gebruikt het in sommige bedrijven.

De verkrapping van het aanbod door Google heeft niet alleen gevolgen voor Meta, maar ook voor andere klanten die Google Cloud en Gemini gebruiken, maar Meta valt op omdat de vraag veel hoger is dan vergelijkbare klanten. In tegenstelling tot Google, Microsoft en Amazon exploiteert Meta geen eigen cloud computing-activiteiten, wat betekent dat het naast de interne, zelf ontwikkelde AI-systemen externe rekenkracht en modeldiensten van concurrenten moet kopen. In de context van een snelle expansie van de binnenlandse vraag wordt dit structurele afhankelijkheidsprobleem nog groter.

Om aan de stijgende vraag naar AI het hoofd te bieden, is Google de afgelopen jaren de investeringen in datacenters en speciale hardware blijven verhogen. De kwartaalomzet van de cloudactiviteiten heeft de 20 miljard dollar overschreden, en de achterstand aan onvoltooide bestellingen bedraagt bijna 460 miljard dollar, wat aantoont dat de totale vraag op de markt voor rekenkracht de bestaande productiecapaciteit ruimschoots overtreft. Google zei dat zijn first-party model meer dan 16 miljard tokens per minuut verwerkte via directe API-aanroepen, een stijging van ongeveer 60% ten opzichte van het voorgaande kwartaal. Dit bevestigde ook van de kant dat in de commercialiseringsfase van grote modellen rekenkracht en capaciteit belangrijke knelpuntbronnen worden.

Meta probeert hetzelfde probleem op een andere manier op te lossen: aan de ene kant breidt het bedrijf zijn eigen datacenter uit, en aan de andere kant werkt het samen met Broadcom aan de ontwikkeling van op maat gemaakte MTIA-versnellingschips, in de hoop de afhankelijkheid van cloudservices en modelaanbieders zoals Google in de toekomst geleidelijk te verminderen. Na de tegenslag in zijn weddenschap op de Metaverse, moet Meta dringend een ‘next platform’-verhaal op het gebied van AI neerzetten. Dit incident van 'beperkte' beschikbaarheid als gevolg van een te grote afhankelijkheid van externe modellen bracht ook de tekortkomingen en urgentie van de infrastructuur en de indeling van de rekenkracht aan het licht.