OpenAI brengt open source jeugdveiligheidstoolkit uit om ontwikkelaars te helpen veiliger AI-applicaties te bouwen

OpenAI kondigde dinsdag de lancering aan van een op jongeren gerichte toolkit voor veiligheidsbeleid voor ontwikkelaars, met als doel applicaties van derden te helpen veiligheidsregels op te nemen om minderjarigen vanaf het begin van hun ontwerp te beschermen. De toolkit is beschikbaar als een reeks direct opvraagbare "Jeugdveiligheidsbeleid"-prompts en kan worden gebruikt met OpenAI's open source gewogen veiligheidsmodel gpt-oss-safeguard.

OpenAI zei dat ontwikkelaars niet helemaal opnieuw hoeven te beginnen bij het ontwerpen van veiligheidsmechanismen voor minderjarigen, en deze reeks promptwoorden direct kunnen gebruiken om bestaande of nieuw ontwikkelde AI-toepassingen te ‘versterken’. Dit beleid is gericht op gevoelige gebieden zoals expliciet geweld en pornografische inhoud, schadelijk lichaamsbeeld en schadelijk gedrag, risicovolle activiteiten en uitdagingen, romantische of gewelddadige rollenspellen, en goederen en diensten met een leeftijdsbeperking. Het bedrijf benadrukt dat dit beveiligingsbeleid wordt aangeboden in de vorm van prompte woorden, zodat het gemakkelijk kan worden aangepast aan andere modellen dan gpt-oss-safeguard, maar het effect zal naar verwachting beter zijn bij gebruik binnen OpenAI's eigen ecosysteem.

Bij het ontwikkelen van het beleid werkt OpenAI samen met derde partijen op het gebied van jeugd- en inhoudveiligheid, waaronder AI-veiligheidswaakhond Common Sense Media en Everyone.ai. Robbie Torney, hoofd van AI en digitale beoordeling bij Common Sense Media, zei in een verklaring dat dit snelle, op woorden gebaseerde beleid helpt een zinvolle beveiligingsbasis voor het hele ecosysteem tot stand te brengen, en dat de open source-releasemethode alle partijen ook in staat stelt zich voortdurend aan te passen en te verbeteren in de loop van de tijd.

OpenAI wijst er in een begeleidend blog op dat zelfs ervaren teams in de praktijk vaak moeite hebben om abstracte beveiligingsdoelstellingen te vertalen naar concrete, afdwingbare regels. Het bedrijf is van mening dat deze afwijking kan leiden tot mazen in de beschermingsmaatregelen, inconsistente implementatienormen en zelfs overmatige blokkering. Een duidelijk en goed afgebakend beleid is dus een belangrijke basis voor het bouwen van een effectief beveiligingssysteem.

OpenAI erkent ook dat deze reeks beleidsmaatregelen niet alle complexe uitdagingen van AI-veiligheid fundamenteel kan oplossen. Maar het bedrijf benadrukte dat de nieuwe tool een verdere uitbreiding is van de bestaande beveiligingsmaatregelen, waaronder ouderlijk toezicht op productniveau, leeftijdsvoorspelling en andere functies. In 2025 heeft OpenAI de gedragsspecificatie (Model Spec) van zijn grote taalmodel bijgewerkt om te verduidelijken hoe het model moet reageren en beperken wanneer het wordt geconfronteerd met gebruikers onder de 18 jaar.

Toch wordt OpenAI geconfronteerd met vragen over zijn eigen veiligheidsrecord. Het bedrijf wordt momenteel geconfronteerd met meerdere rechtszaken die zijn aangespannen door familieleden van gebruikers die zelfmoord hebben gepleegd na extreem gebruik van ChatGPT. De rechtszaak beweert dat sommige van de gevaarlijke relaties die zijn ontstaan nadat gebruikers de beveiliging van chatbots hebben omzeild, en dat de verdediging van geen enkel huidig model echt ‘ondoordringbaar’ is. Tegen deze achtergrond is de industrie over het algemeen van mening dat, hoewel dit open source veiligheidsbeleid voor jongeren niet de ultieme oplossing is, het een relatief eenvoudig te gebruiken compliance-traject biedt voor onafhankelijke ontwikkelaars en kleine teams, en wordt beschouwd als een nieuwe stap voorwaarts in het bevorderen van AI-veiligheidspraktijken voor minderjarigen.

leer meer:

https://github.com/openai/teen-safety-policy-pack