SemiAnalysis, een organisatie voor brancheanalyse, heeft onlangs een daadwerkelijke test uitgevoerd met de abonnementen op meerdere niveaus van OpenAI en Anthropic. De resultaten toonden aan dat er achter de betaalbare maandelijkse kosten een enorme subsidiekloof voor rekenkracht schuilgaat. Het bureau kocht verschillende abonnementen van de twee bedrijven en bleef zware taken uitvoeren, zoals langetermijnprogrammering en 'intelligente agenten' totdat de wekelijkse gebruikslimiet werd bereikt, en berekende vervolgens de theoretische kosten die overeenkomen met dit gebruik op basis van openbare API-prijzen.

Berekeningsresultaten laten zien dat als OpenAI’s “ChatGPT Pro 20x”-abonnement met een prijs van US$200 volledig wordt gebruikt, de bijbehorende API-facturering een maximum van ongeveer US$14.000 kan bereiken. De “Claude Max 20x”-oplossing van Anthropic, die voor dezelfde prijs geprijsd is, kan onder extreme gebruiksomstandigheden de theoretische tokenkosten van ongeveer US$ 8.000 benaderen. Dit betekent dat een klein aantal zware gebruikers voldoende is om de oorspronkelijk beperkte winstmarges onder het abonnementsmodel op te eten.
Volgens de analyse van SemiAnalysis is dit een van de redenen waarom grote modelbedrijven speciale aandacht besteden aan ‘gebruik’. Voor Anthropic kan het bedrijf op niveaus als Claude Pro en Claude Max 5x ongeveer break-even draaien als het daadwerkelijke gebruikersgebruik ongeveer 20% bereikt. Ter vergelijking: de winstmarges van OpenAI zijn zelfs nog kleiner: op ChatGPT Plus- en ChatGPT Pro 5x-abonnementen begint het bedrijf geld te verliezen aan die gebruiker zodra het gebruik de 11,4% overschrijdt.
Bij duurdere topplannen wordt de economische structuur verder krapper. Het rapport wees erop dat de brutowinstmarge van Anthropic op high-end abonnementen bijna nul was toen de bezettingsgraad ongeveer 10% bereikte, terwijl OpenAI in het negatieve brutowinstbereik viel toen de bezettingsgraad ongeveer 5,7% bedroeg. Met andere woorden, gebruikers hoeven geen extreem hoge gebruiksfrequentie te bereiken om deze abonnementen te laten veranderen van "winstgevende producten" naar "verliesgevende producten".
In deze context is het voor fabrikanten een lastig probleem geworden om de prijzen aan te passen of de toegang te beperken. Het abonnementsmodel met een vast maandelijks bedrag is een sleutelfactor in de snelle populariteit van producten als ChatGPT en Claude. Zodra de quota worden aangescherpt of de drempels worden verhoogd, kan het momentum van de gebruikersgroei worden verzwakt. In de huidige grootschalige model-‘wapenwedloop’ zijn de capaciteit en beschikbaarheid van modellen nog steeds een van de belangrijkste concurrentiechips, wat het voor bedrijven moeilijker maakt om hun strategieën gemakkelijk aan te passen.
Aan de andere kant zorgen veranderingen in de manier waarop AI daadwerkelijk wordt gebruikt ook voor een stijging van de kostendruk. Het rapport wees erop dat het tokenverbruik van nieuwe workflows, vertegenwoordigd door meerstaps ‘agent’-systemen die autonoom tools aanroepen, duizend keer zo hoog kan zijn als bij traditionele enkelvoudige gesprekken. Dit oproeppatroon met hoge intensiteit heeft sommige grote ondernemingen gedwongen de interne openheid en kostenbeheersingsstrategieën van AI-tools opnieuw te onderzoeken.
Volgens rapporten hebben bedrijven als Microsoft, Meta en Amazon hun eerdere praktijken om werknemers aan te moedigen grootschalige tests en interne promoties uit te voeren teruggeschroefd vanwege de snelle stijging van de interne rekeningen. In één veelbesproken zaak verbrandde een bedrijf in slechts één maand 500 miljoen dollar aan de diensten van Anthropic, zonder enige beperking op te leggen aan het gebruik van Claude door werknemers, wat direct leidde tot interventie op het gebied van noodbeheer.

Onder druk van de kosten en de feitelijke vraag beginnen steeds meer ondernemingen verfijndere modelrouteringsstrategieën toe te passen. Eén benadering is om complexe, hoogwaardige problemen over te dragen aan dure ‘frontier-modellen’ (frontier-modellen), terwijl routinematig kantoorwerk en fundamentele vraag- en antwoordtaken worden gedelegeerd aan goedkopere modellen. Door taken op deze manier te ontlasten kunnen sommige bedrijven de totale AI-kosten met maar liefst 95% verlagen, zo citeert The Wall Street Journal onderzoek. Vishal Misra, universitair hoofddocent van Columbia University, wees erop dat bedrijven niet altijd grote modellen van het hoogste niveau nodig hebben die “de kwantumzwaartekracht begrijpen”. Veel open source-modellen zijn voldoende voor de dagelijkse behoeften, waardoor ook de premiumruimte van dure gesloten modellen wordt ondermijnd.
Sommige AI-startups hebben radicalere migraties gemaakt. Flo Crivello, oprichter en CEO van AI-assistent-startup Lindy, zei dat het bedrijf 100% van zijn verkeer heeft overgeschakeld naar DeepSeek V4, waarmee het volledig is gemigreerd van het Anthropic-model. In hun evaluatie was DeepSeek V4 qua mogelijkheden vergelijkbaar met Claude Sonnet, tegen een fractie van de kosten, een migratie die het bedrijf naar verluidt miljoenen dollars heeft bespaard.
Anderen kiezen ervoor om hun eigen systemen te bouwen op basis van open source-modellen, waarbij ze interne gegevens combineren met hun eigen infrastructuur in ruil voor een beter beheersbare kostenstructuur op de lange termijn. Hoewel dit pad een hogere initiële investering vereist, helpt het de afhankelijkheid van externe cloud-AI-leveranciers te verminderen en kunnen bedrijven meer gedetailleerde controle krijgen over gevolgtrekkingskosten, gegevensbeveiliging en prestatie-optimalisatie. In specifieke verticale scenario's kunnen interne modellen die zijn verfijnd, zelfs beter presteren dan geavanceerde modellen voor algemeen gebruik.
Op de middellange tot lange termijn verwacht de industrie over het algemeen dat sommige kosten geleidelijk zullen afnemen als gevolg van de uitbreiding van de infrastructuur, de hardware-evolutie en modelherhaling. SemiAnalysis voorspelt dat met het mid-tot-high-end capaciteitsniveau dat wordt vertegenwoordigd door de huidige Opus 4.8, dit naar verwachting in de toekomst op winstgevende wijze zal worden geleverd tegen een prijs van ongeveer US $ 20 per maand via meer volwassen technologie en efficiëntere rekenkracht. Maar dit oordeel is niet van toepassing op de meest geavanceerde topmodellen, waarvan de exploitatiekosten in de nabije toekomst hoog zullen blijven en waarschijnlijker in rekening zullen worden gebracht via API-facturering, gelaagde ontgrendeling van functies, enz., in plaats van eenvoudigweg te worden verpakt in een uniform abonnementsplan voor de massa.
Tot die tijd moeten AI-dienstverleners nog steeds een moeilijk evenwicht vinden tussen twee richtingen: aan de ene kant willen gebruikers de krachtigste AI-mogelijkheden verkrijgen die mogelijk zijn tegen een laag en voorspelbaar maandbedrag; aan de andere kant zijn de onderliggende rekenkracht en infrastructuur die deze mogelijkheden ondersteunen nog steeds duur en zeer gevoelig voor de gebruiksintensiteit. Sam Altman, CEO van OpenAI, gaf ook publiekelijk toe dat de tokenkosten een steeds ernstiger probleem worden, en het bedrijf werkt er hard aan om producten en architectuur te optimaliseren, zodat gebruikers "meer waarde kunnen bereiken met minder uitgaven" bij het gebruik van ChatGPT.