De Amerikaanse regering zou het nieuwste AI-model van Anthropic met spoed hebben geblokkeerd omdat het vertrouwelijke systeem van de NSA was gekraakt

Anthropic, een Amerikaanse AI-startup, is onlangs in een ongekende storm van regelgeving terechtgekomen: het heeft net tien dagen geleden aangekondigd dat zijn meest geavanceerde grootschalige model open zou zijn voor het publiek, maar nu is het dringend opgeschort door de Amerikaanse regering op grond van exportcontrole. De overgrote meerderheid van de gebruikers over de hele wereld heeft geen toegang meer tot de Fable 5- en Mythos 5-modellen. Dit is de eerste keer dat de Verenigde Staten rechtstreeks exportcontrolemaatregelen op het AI-model zelf hebben geïmplementeerd, wat schokken veroorzaakt op meerdere niveaus in de veiligheids-, industrie- en alliantierelaties.

Volgens The Economist meldde de Amerikaanse senator Mark Warner tijdens een geheime briefing op 11 juni dat generaal Joshua Rudd, die tevens directeur is van de National Security Agency (NSA) en commandant van het Amerikaanse Cyber Command, hem vertelde dat het Mythos-model van Anthropic de verdediging van de meeste geheime systemen van de NSA doorbrak tijdens een geautoriseerde rode teamoefening, niet in weken of dagen, maar in ‘uren’. Deze bewering is nog niet officieel bevestigd door welke overheidsinstantie dan ook, en de relevante details blijven vertrouwelijk, maar het werd al snel het dominante verhaal dat verklaart waarom de Amerikaanse regering op 12 juni plotseling een ernstig exportverbod uitvaardigde: een AI-model van een commercieel bedrijf brak in korte tijd in in een van 's werelds zwaarst bewaakte geheime infrastructuren.

Toen Anthropic Mythos in april van dit jaar voor het eerst bekendmaakte, werd duidelijk dat het model te krachtig was in het ontdekken van kwetsbaarheden in de softwarebeveiliging en het risico liep te worden misbruikt, zodat het niet voor het publiek toegankelijk zou zijn. Het zou alleen toegang bieden tot ongeveer 200 streng gecontroleerde partners in het kader van een project genaamd Project Glasswing, waaronder Amazon, Apple, Google, Microsoft, Nvidia, JPMorgan Chase en de Linux Foundation. Sindsdien heeft Mythos geholpen duizenden kwetsbaarheden in de echte wereld bloot te leggen, waaronder een beveiligingsfout die al 27 jaar in OpenBSD sluimerde en 271 nieuwe problemen in de Mozilla Firefox 150-browser.

Op 9 juni lanceerde Anthropic het Fable 5-model voor het publiek. De onderliggende basis is dezelfde als die van Mythos, maar er wordt een beveiligingsclassificator bovenop geplaatst om verzoeken die als gevaarlijk worden beschouwd te onderscheppen en deze verzoeken om te leiden naar minder capabele modellen voor verwerking. Het standpunt van Anthropic is dat deze "vangrails" voldoende zijn om Fable 5 veilig te maken voor het publiek; maar nadat de getuigenis van generaal Rudd over de penetratietests van de NSA aan het licht kwam, was de Amerikaanse regering het blijkbaar niet eens met dit oordeel en geloofde ze dat tussen Mythos en Fable 5 de ‘capaciteitskloof’ die door de beveiligingsclassificator alleen werd veroorzaakt, niet voldoende was om een betrouwbare verdedigingslinie te vormen.

De directe aanleiding voor dit alles was een ‘jailbreak’-rapport. De Amerikaanse regering heeft Anthropic op 12 juni ervan in kennis gesteld dat zij een manier had ontdekt om de Fable 5-beveiligingsclassificatie te omzeilen, waardoor mogelijk haar meest gevoelige cyberoffensieve en defensieve capaciteiten konden worden ontgrendeld. Volgens Anthropic werd de regering alleen mondeling op de hoogte gebracht van de kwetsbaarheid, waarbij ze deze omschreef als een "potentiële, beperkte, niet-universele jailbreak" en het bedrijf 90 minuten de tijd gaf om actie te ondernemen. De jailbreak werd voor het eerst gemeld aan het Amerikaanse ministerie van Handel door Amazon, een belangrijke investeerder in Anthropic en een concurrent op AI-gebied. Tegelijkertijd plaatste een onderzoeker die het pseudoniem "Plinius de Bevrijder" gebruikte, zijn zelfbenoemde volledige systeempromptwoord op X en GitHub binnen 48 uur nadat Fable 5 online ging.

Geconfronteerd met druk van de overheid reageerde Anthropic door de nadruk te leggen op zijn oordeel dat de impact van deze jailbreak beperkt en niet universeel was, en de algehele veiligheid van Fable 5 niet fundamenteel teniet deed. Het bedrijf wees er ook op dat soortgelijke beveiligingskwetsbaarheden voorkomen in andere modellen die open zijn voor het publiek, waaronder OpenAI's GPT-5.5, maar deze modellen worden niet geconfronteerd met dezelfde intensiteit van exportcontroles. Anthropic waarschuwde in een verklaring dat als de huidige standaarden voor Fable 5 in de hele industrie zouden worden toegepast, "bijna alle toonaangevende modelaanbieders gedwongen zouden worden de implementatie van nieuwe modellen stop te zetten."

Sommigen in de veiligheidsgemeenschap zijn het eens met de beoordeling van Anthropic. Voormalig Facebook-hoofdbeveiligingsfunctionaris Alex Stamos zei dat hij het relevante onderzoek had beoordeeld en geloofde dat het wel bevindingen bevatte die de aandacht waard waren, maar geen ‘unieke capaciteiten’ vertoonde die deze extreme reactie zouden rechtvaardigen. De adviseur van de Trump-regering, David Sacks, was echter een tegengestelde mening toegedaan en zei dat het moeilijk te begrijpen was hoe Anthropic kon beweren dat een jailbreak die voldoende was om het cyberwapen volledig operationeel te maken, als ‘niet ernstig’ kon worden gedefinieerd.

De politieke achtergrond maakt het voor buitenstaanders moeilijker om dit besluit als een puur technische veiligheidskwestie te beschouwen. In februari beval de regering-Trump alle federale agentschappen om te stoppen met het gebruik van de modellen van Anthropic, nadat het bedrijf weigerde contractvoorwaarden te ondertekenen die het gebruik van zijn AI in autonome wapensystemen en grootschalige binnenlandse surveillance mogelijk zouden hebben gemaakt. Het Pentagon classificeerde Anthropic vervolgens als een ‘toeleveringsketenrisico’, waardoor militaire aannemers zijn modellen niet mochten gebruiken, en Anthropic vecht deze benaming momenteel aan bij de federale rechtbank. Door deze reeks conflicten lijkt deze exportcontrole meer op het uitbreken van een langetermijnspel, gestimuleerd door grote veiligheidsincidenten.

Het diepere probleem ligt in het ontbreken van instituties. Sommige analisten wezen erop dat de Verenigde Staten nog steeds geen stabiel en transparant raamwerk hebben om de veiligheidsrisico’s van geavanceerde AI-modellen te evalueren en te beheersen. Op 2 juni vaardigde de regering-Trump een uitvoerend bevel uit waarin ze AI-bedrijven opriepen om de regering ‘vrijwillig’ dertig dagen vooraf toegang te geven tot een nieuwe generatie geavanceerde modellen voordat deze publiekelijk worden vrijgegeven. Fable 5 ging echter na 7 dagen direct online en voldeed niet aan dit ‘vrijwillige raamwerk’. In praktische termen werd het verbod van 12 juni een moeilijk middel om bedrijven te dwingen mee te werken aan de controle door de overheid. In een analyseartikel op de website ‘Dialogue’ wordt gesteld dat het essentiële probleem is dat de overheid niet over de gegevens, de infrastructuur en de professionele capaciteiten beschikt die nodig zijn om op onafhankelijke wijze baanbrekende eigen modellen te evalueren, en dat haar afhankelijkheid van ondernemingen ook in een of andere vorm wordt erkend in dit uitvoeringsbesluit.

De impact van dit verbod strekt zich uit tot ver buiten de Verenigde Staten. Toen de toegang tot Fable 5 en Mythos 5 volledig werd afgesloten, werden Australië, het Verenigd Koninkrijk, Canada en Nieuw-Zeeland, de traditionele Amerikaanse inlichtingenalliantie bekend als de Five Eyes, tegelijkertijd zonder waarschuwing buitengesloten. Het Britse AI Safety Research Institute, dat wordt beschouwd als 's werelds toonaangevende instelling voor het testen van geavanceerde modellen, verloor plotseling de toegang tijdens het evaluatieproces van gerelateerde systemen. Daartoe hebben de inlichtingendiensten van de vijf landen maandag een zeldzame gezamenlijke verklaring afgegeven. Hoewel Anthropic of Mythos niet werden genoemd, verwees de context ongetwijfeld naar de huidige situatie.

In de gezamenlijke verklaring wordt erop gewezen dat van de allernieuwste AI-modellen wordt verwacht dat ze de huidige verwachtingen van de sector zullen overtreffen en het landschap van netwerkaanval- en verdedigingsmogelijkheden fundamenteel zullen veranderen. Het tijdvenster voor gerelateerde risico's wordt niet langer gemeten in "jaren", maar in "maanden". Het document werd ondertekend door hoge functionarissen, waaronder NSA-cyberbeveiligingshoofd David Imbordino en waarnemend CISA-directeur Nick Andersen. De verklaring waarschuwde dat AI de drempel voor kwaadwillende actoren aanzienlijk zal verlagen om aanvallen uit te voeren en dezelfde oude problemen te blijven exploiteren die al jaren niet zijn opgelost: ongepatchte systemen, zwakke identiteitsbeheercontroles en diensten die onnodig aan internet worden blootgesteld. De verklaring benadrukte dat cyberrisico niet langer een puur technische kwestie is, maar een kernrisico en leiderschapsverantwoordelijkheid voor ondernemingen.

Olivia Shen, een expert op het gebied van nationale veiligheid en AI aan de Universiteit van Sydney in Australië, wees erop dat buitenstaanders hun visie niet moeten beperken tot antropisch. Ze is van mening dat de industrie moet verwachten dat "de volgende Mythos of de volgende Fabel binnenkort zal verschijnen", en dat het publiek momenteel alleen het vrijgegeven model kan zien, en dat er mogelijk even geavanceerde of zelfs geavanceerdere systemen zijn ontwikkeld door China of andere landen en dat actoren achter gesloten deuren naar voren worden gebracht. Beveiligingsmedia CyberScoop wezen erop dat de aanvalsmogelijkheden die worden genoemd in het Amazon Threat Intelligence Report dat aanleiding gaf tot deze overheidsactie feitelijk kunnen worden bereikt met behulp van modellen van de oudere generatie, zoals Claude Opus, Claude Sonnet, en zelfs open source Chinese modellen die niet onderworpen zijn aan enige Amerikaanse exportcontrole. Open source-modellen hebben traditioneel een achterstand van zes tot acht maanden op het gebied van capaciteiten, dus het is een open vraag of het uitschakelen van Fable 5 een opzettelijke tegenstander daadwerkelijk aanzienlijk zal vertragen.

Vanaf nu zijn Fable 5 en Mythos 5 voor de meeste gebruikers nog steeds offline. Anthropic vertelde de media eerder dat het bedrijf "er alle vertrouwen in heeft dat de beschikbaarheid van modellen de komende dagen zal worden hersteld", maar dit standpunt is nog niet vervuld. Kansen gegeven door voorspellingsmarkten schatten de kans op herstel van de toegang vóór 1 juli op ongeveer 57%. Trump zei vorige week in een interview met Axios dat hij Anthropic niet langer als een bedreiging voor de nationale veiligheid beschouwde, en zei: "Misschien was het een week geleden, maar niet nu." De twee partijen ontmoetten elkaar tijdens de G7, en Trump merkte op de voortgang van de onderhandelingen op dat "alles heel goed gaat".

Tientallen mensen, waaronder cybersecurityonderzoekers, AI-ondernemers en bedrijfsleiders, hebben maandag gezamenlijk een brief aan het Witte Huis geschreven waarin ze de regering oproepen om zich in te zetten voor een “open, wetenschappelijk en transparant” proces in toekomstige AI-risicobeoordelings- en responsprocessen. Er wordt aangenomen dat een meer operationeel signaal afkomstig kan zijn van het identiteitsverificatiebeleid van Anthropic, dat naar verwachting op 8 juli van kracht zal worden, waardoor het bedrijf kan verifiëren of gebruikers Amerikaanse staatsburgers zijn, waardoor hopelijk de beschikbaarheid van het model in de Verenigde Staten wordt hersteld zonder het exportcontrolebevel volledig in te trekken.

Hoewel het nog steeds onduidelijk is hoe het verbod op korte termijn zal eindigen, hebben de afgelopen tien dagen duidelijk een keerpunt gemarkeerd: dit is de eerste keer dat de Verenigde Staten exportcontroles rechtstreeks op het AI-model zelf hebben geplaatst, in plaats van op de hardwareapparatuur die de werking ervan ondersteunt. Europa houdt dit precedent nauwlettend in de gaten, uit angst dat een soortgelijke situatie zich in de toekomst zou kunnen herhalen op Azure, AWS of Google Cloud. De voormalige Britse minister van Veiligheid, Tom Tugendhat, zei ronduit dat landen na zo’n ‘intuïtieve les’ zullen gaan nadenken over hoe ze de soevereine capaciteiten van hun land op het gebied van kritische cloud- en AI-infrastructuur kunnen verwezenlijken. Of Mythos daadwerkelijk binnen een paar uur heeft ingebroken in de meeste geheime systemen van de NSA, is door geen enkele overheidsinstantie onafhankelijk bevestigd, en de specifieke details zijn nog steeds verborgen in geheime documenten.