De goudkoorts op het gebied van kunstmatige intelligentie put snel een onmisbare hulpbron voor AI-ontwikkelaars uit: rekenkracht. Dit ernstige tekort aan rekenkracht heeft geleid tot angst onder zware gebruikers, heeft bedrijven gedwongen bepaalde producten op te geven en heeft problemen met de stabiliteit van de dienstverlening veroorzaakt. Deze problemen hebben de noodklok laten luiden voor de AI-rage: net nu een groot aantal gebruikers begint te vertrouwen op geavanceerde AI-tools om de productiviteit te verbeteren, kunnen knelpunten in de rekenkracht de daadwerkelijke effectiviteit van deze krachtige nieuwe tools beperken.

De afgelopen maanden is de vraag naar ‘intelligente AI’ geëxplodeerd. Deze autonome AI-tools kunnen zelfstandig een verscheidenheid aan taken uitvoeren, van het schrijven van softwarecode tot het plannen van huisrondleidingen voor makelaars in onroerend goed. Bedrijven doen hun uiterste best om computerbronnen in te zetten om een ​​groeiende gebruikersbasis met een aanzienlijk toegenomen gebruiksintensiteit te bedienen.

“Iedereen heeft het over olie, maar ik denk dat het echte mondiale tekort de tokens zijn”, zegt Ben Pouladian, een ingenieur en technologie-investeerder uit Los Angeles. Token is een meeteenheid die in AI wordt gebruikt om de rekenkracht te meten die door taken wordt verbruikt. “De AI van vandaag is niet langer alleen maar een chatbot die voor de koelkast staat en om recepten vraagt. Het coördineert taken en wordt steeds intelligenter.”

Dit alles wijst op een terugkerend klassiek probleem in de geschiedenis van de technologische welvaart: vanaf de uitbreiding van de spoorwegen in de 19e eeuw tot de explosie van de telecommunicatie en het internet in het begin van de 21e eeuw is het groeitempo van de vraag altijd veel groter geweest dan de snelheid waarmee bedrijven grondstoffen kunnen verkrijgen en infrastructuur kunnen opbouwen. Historisch gezien zijn prijsstijgingen vaak het enige middel geweest om aanbodtekorten aan te pakken, maar een dergelijke stap brengt enorme risico's met zich mee voor geavanceerde AI-bedrijven, die hevig concurreren om gebruikers.

De huurprijzen per uur voor grafische verwerkingseenheden (GPU’s) die worden gebruikt om AI-modellen te trainen en uit te voeren, zijn sinds afgelopen herfst enorm gestegen. Anthropic, het bedrijf dat de populaire chatbot Claude en zijn populaire programmeertool Claude Code ontwikkelt, heeft de laatste tijd regelmatig te maken gehad met servicestoringen. Het bedrijf is begonnen met het opleggen van tokengebruikslimieten aan gebruikers tijdens piekuren, maar deze maatregel heeft ertoe geleid dat een groot aantal gebruikers heeft geklaagd en zei dat ze de gebruikslimiet snel bereikten.

Volgens rapporten heeft OpenAI zijn videogeneratie-applicatie Sora stopgezet, deels om rekenkracht vrij te maken ter ondersteuning van nieuwe AI-modelgestuurde programmering en bedrijfsproducten met de codenaam Spud.

Het tokengebruik van het OpenAI-platform voor zakelijke gebruikers steeg van 6 miljard per minuut in oktober vorig jaar naar 15 miljard eind maart.

"Ik heb wel veel tijd besteed aan het zoeken naar alle rekenkracht waar tijdelijk een beroep op gedaan kon worden." Sarah Fryer, Chief Financial Officer van OpenAI, zei dit in een recent openbaar video-interview met investeerders. "Door onvoldoende rekenkracht zijn we momenteel genoodzaakt om een ​​aantal projecten stop te zetten en hele lastige keuzes te maken."

Eind vorig jaar verhoogde CoreWeave, een van de grootste beursgenoteerde AI-cloudcomputingbedrijven, de prijzen met meer dan 20% en eiste van kleinere klanten dat ze servicecontracten voor ten minste drie jaar tekenden, vergeleken met de periode daarvoor. Analisten van de Bank of America herstelden eind vorige maand hun rating voor het bedrijf en gaven het een koopadvies, waarbij ze zeiden dat de vraag naar zijn diensten tot minstens 2029 het aanbod zal blijven overtreffen.

Uit gegevens van de New Yorkse dataprovider Ornn blijkt dat de spothuurprijzen voor NVIDIA's volledige assortiment GPU's in clouddatacenters de afgelopen maanden aanzienlijk zijn gestegen. De prijsindex van Ornn Compute laat zien dat het huurtarief voor één uur voor Nvidia's meest geavanceerde chips uit de Blackwell-serie US$ 4,08 heeft bereikt, een stijging van 48% ten opzichte van US$ 2,75 twee maanden geleden.

Sinds medio februari heeft het hele systeem van Anthropic regelmatig te maken gehad met downtime, en sommige zakelijke klanten zijn overgestapt op het gebruik van modellen van andere AI-leveranciers.

David Hsu, oprichter en CEO van softwareontwikkelingsplatform Retool, zei dat hij aanvankelijk de voorkeur gaf aan het Opus 4.6-model van Anthropic om de AI-agenttool van het bedrijf aan te sturen, omdat hij geloofde dat dit het model was dat het meest geschikt was voor bedrijfsscenario's. Maar hij is onlangs overgestapt op het OpenAI-model. "De service van Anthropic heeft regelmatig last van storingen."

De betrouwbaarheid van internetkerndiensten wordt doorgaans gemeten met “enkele negens”. De vier negens zijn een online percentage van 99,99%, wat ook een veel voorkomende belofte is die softwarebedrijven aan klanten doen. Op 8 april bedroeg het onlinepercentage van de Claude API van Anthropic in de afgelopen 90 dagen slechts 98,95%.

“Dit is abnormaal”, zegt Amir Haghighat, medeoprichter en chief technology officer van Baseten, een startup voor AI-inferentie. "Denk aan AWS, databases, RDS of Stripe. Ze vereisen allemaal extreem hoge stabiliteit en online tarieven. Maar dat is op dit moment niet het geval op AI-gebied. Dit is niet de kwaliteit van de dienstverlening die je wilt krijgen van een bedrijf dat intelligente mogelijkheden biedt voor applicaties."

Anthropic maakt een explosieve groei door, ondanks frequente servicestoringen. Eind 2025 bedroeg de jaaromzet van het bedrijf 9 miljard dollar; in februari van dit jaar was dit aantal gestegen tot 14 miljard dollar; twee maanden later verdubbelde het opnieuw tot 30 miljard dollar.

Eind maart kondigde Anthropic plotseling aan dat het het tokenverbruik van gebruikers tijdens de piekuren van 05.00 uur tot 11.00 uur Pacific Time op weekdagen zou beperken. Gebruikers klaagden op sociale platforms. Eén gebruiker schreef verder

"We doen ons best om aan de groeiende behoeften van Claude te voldoen." Boris Cherny, hoofd van Claude Code en ontwikkelaar, zei verder