Een persoon die bekend is met de zaak onthulde dat OpenAI de laatste hand legt aan een nieuw model met geavanceerde netwerkbeveiligingsmogelijkheden en van plan is dit alleen aan een klein aantal zakelijke klanten aan te bieden, vergelijkbaar met Anthropic's kleinschalige release van zijn netwerkbeveiligingsmodel "Mythos". De reden waarom het de aandacht trekt is dat kunstmatige intelligentie door veel beveiligingsexperts wordt beschouwd als een ‘kritiek punt’ in termen van autonomie en hackmogelijkheden. Modelontwikkelingsbedrijven maken zich nu steeds meer zorgen over de werkelijke schade die hun eigen instrumenten kunnen aanrichten, zo erg zelfs dat ze niet bereid zijn deze volledig in de publieke omgeving te 'loslaten'.

Dinsdag kondigde Anthropic aan dat zijn nieuwe model "Mythos Preview" alleen open zal staan voor een klein aantal zorgvuldig geselecteerde technologie- en cyberbeveiligingsbedrijven, omdat het model over zeer geavanceerde inbraak- en exploitatiemogelijkheden beschikt, wat aanleiding geeft tot bezorgdheid over mogelijk misbruik. Destijds was Anthropic het eerste AI-bedrijf dat zulke strikte beperkingen oplegde aan zijn nieuwe modelreleasestrategie, en nu is onthuld dat OpenAI van plan is een soortgelijke weg in te slaan.
Kijkend naar de details lanceerde OpenAI in februari van dit jaar een proefproject genaamd "Trusted Access for Cyber" na de lancering van GPT-5.3-Codex, dat tot nu toe over de sterkste mogelijkheden voor netwerkbeveiligingsredenering beschikt. Organisaties die worden uitgenodigd om deel te nemen aan het gesloten programma zullen toegang krijgen tot hogere cyberoffensieve en defensieve capaciteiten of een hoger ‘vergevingsgezind’ model om de juridische defensieve veiligheidsinspanningen te versnellen, aldus een bedrijfsblog. OpenAI beloofde destijds ook dat het in totaal 10 miljoen dollar aan API-quotumondersteuning zou bieden aan projectdeelnemers voor gerelateerde experimenten en implementatie.
De bredere context is dat het afgelopen jaar meerdere voormalige regeringsfunctionarissen en topveiligheidsleiders aan de bel hebben getrokken en hebben gewaarschuwd dat als ze in verkeerde handen vallen, sommige AI-modellen op een dag in staat zouden kunnen zijn om watersystemen, energienetwerken en zelfs de financiële infrastructuur te ontwrichten zonder menselijke tussenkomst. Deze capaciteiten, die voorheen werden beschouwd als ‘toekomstscenario’s’, beginnen nu vorm te krijgen in de ogen van insiders uit de sector.
Maar zelfs als AI-bedrijven tijdelijk “de sluizen dichtdraaien” door middel van beperkte pilots en gefaseerde releases, zijn topveiligheidsexperts over het algemeen van mening dat de algemene trend moeilijk te keren is. "Je kunt niet voorkomen dat het model code-opsommingen uitvoert of gaten in de oude codebasis vindt. Deze mogelijkheid bestaat objectief al." Rob T. Lee, chief AI officer van het SANS Institute, wees erop. Wendi Whitmore, Chief Security Intelligence Officer bij Palo Alto Networks, zei in een rondetafelgesprek op de HumanX-conferentie in San Francisco dat het misschien nog maar een paar weken of maanden duurt voordat het volgende model met vergelijkbare mogelijkheden opduikt en naar een meer open omgeving stroomt. Adam Meyers, Senior Vice President of Countermeasures van CrowdStrike, beschreef de door Mythos gedemonstreerde capaciteiten als ‘een wake-up call voor de hele industrie’.
Volgens sommige beveiligingsprofessionals zou het, als het bedrijf zich echt zorgen maakt over het vermogen van het model om "nieuwe aanvals- en exploitatieprogramma's te schrijven" in plaats van alleen maar "mensen te helpen bestaande kwetsbaarheden te vinden", "redelijker" zijn om de lanceringsmogelijkheden van geavanceerde modellen te beperken en batchreleases te implementeren. Stanislav Fort, CEO van Aisle Security Company, vertelde Axios dat de mogelijkheid om automatisch een nieuwe exploitatieketen voor kwetsbaarheden te genereren potentieel bedreigender is voor het ecosysteem dan alleen het ontdekken van fouten, en dat dit daarom langzaam moet worden geverifieerd in een gecontroleerde omgeving.
Sommige experts wezen er ook op dat het huidige grootschalige model in fasen wordt geopend, wat tot op zekere hoogte sterk lijkt op de manier waarop traditionele leveranciers van netwerkbeveiliging informatie over softwarekwetsbaarheden vrijgeven. Lee is van mening dat dit sterk lijkt op het debat dat de industrie door de jaren heen heeft gevoerd rond ‘verantwoorde openbaarmaking van kwetsbaarheden’: hoe de timing en reikwijdte in evenwicht te brengen tussen het openbaar maken van risico’s en het verstrekken van patches is een herhaaldelijk besproken kwestie. Het verschil is dat wat deze keer "uitgesteld werd" niet langer een enkele softwarekwetsbaarheid is, maar een algemeen intelligent hulpmiddel dat de aanvals- en verdedigingsmogelijkheden enorm kan versterken.
Het is onduidelijk of OpenAI dit opkomende cyberbeveiligingsmodel op een bepaald moment in de toekomst breder op de markt zal brengen. Anthropic heeft daarentegen duidelijk gemaakt dat het de Mythos Preview niet volledig aan het publiek zal vrijgeven, maar als het in de toekomst kan worden uitgerust met voldoende sterke veiligheidsleuningen, sluit het de mogelijkheid niet uit om een breder scala aan openingen voor andere modellen in de Mythos-serie te overwegen. Tegelijkertijd herinnerden onderzoeksteams zoals Aisle er ook aan dat bestaande AI-modellen die algemeen op de markt verkrijgbaar zijn, al een aanzienlijk aantal kwetsbaarheden en exploitatiepaden kunnen vinden in Mythos-demonstratiegevallen. Dit betekent dat wat werkelijk de veiligheidsgracht vormt waarschijnlijk meer de systemen en processen zijn die rond het model zijn gebouwd, dan het 'volume' en de 'generatie' van het model zelf.