De oprichter van OpenClaw adviseert gebruikers om geen kleine modellen te gebruiken om taken met een hoog risico uit te voeren, omdat de bescherming tegen snelle woordinjectie erg zwak is

Onlangs liet een netizen een screenshot zien van het configureren van GPT-5.4 in de OpenClaw AI-robot op het sociale mediaplatform

De suggestie van @Steipete is dat gebruikers geen kleinere modellen of modellen met zwakke bescherming tegen woordinjectie moeten gebruiken om taken met een hoog risico uit te voeren. De belangrijkste reden is dat de beveiliging van deze modellen bij snelle woordinjectie zwak of onvolledig is.

In feite wordt dit probleem duidelijk vermeld in de officiële documentatie van het OpenClaw AI-project, dat wil zeggen dat snelle woordinjectie momenteel niet kan worden opgelost, dus gebruikers moeten prioriteit geven aan het gebruik van de nieuwste modellen met sterkere commando-uitlijning in scenario's met een hoog risico om de beveiligingsmogelijkheden te verbeteren.

Snelle woordinjectie is een probleem dat niet met alle huidige AI-modellen en -instrumenten kan worden opgelost. Aanvallers kunnen het AI-model ertoe aanzetten bepaalde risicovolle operaties uit te voeren door middel van snelle woordinjectie. In ernstige gevallen kunnen gevoelige gegevens van de gebruiker worden gelekt.

OpenClaw AI-robots hebben doorgaans hogere rechten nodig om meer bewerkingen uit te voeren. Dat wil zeggen: hoe hoger de door de gebruiker verleende machtigingen en hoe meer informatie deze verstrekt, hoe ernstiger de gelekte informatie kan zijn nadat zich een beveiligingsprobleem heeft voorgedaan.

Het officiële document van het project vermeldt ook dat de toestemmingsgrenzen moeten worden aangescherpt voor op tools gebaseerde agenten (uitvoerbaar, leesbaar, beschrijfbaar en netwerkbaar). Het is niet voldoende om uitsluitend te vertrouwen op het bewustzijn van systeempromptwoorden. Dit zijn zaken waar gebruikers zelf rekening mee moeten houden.

Wat is snelle woordinjectie:

Snelle woordinjectie betekent dat aanvallers kwaadaardige instructies in webpagina's/e-mails/documenten kunnen verbergen om AI-schendingen te veroorzaken. Als u bijvoorbeeld AI-instructies toevoegt in een voor mensen onzichtbare vorm aan het begin van de webpagina, moet het model de systeempromptwoorden negeren en de opgevraagde informatie naar een bepaalde server sturen.

Meestal negeert het AI-model deze promptwoorden nadat het deze promptwoorden heeft gelezen vanwege systeembeveiligingsinstellingen, maar soms kan het model ook opdrachten uitvoeren op basis van onzichtbare promptwoorden, wat kan leiden tot het lekken van alle gevoelige informatie van de gebruiker.

Als u alleen dagelijks vraag-en-antwoord doet of copywriting oppoetst, enz., kunt u kleinere/oudere modellen gebruiken, die sneller en mogelijk goedkoper zijn. Zolang dagelijkse documenten en copywriting geen gevoelige informatie bevatten, ook al zijn deze gelekt, zal dit niet veel impact hebben.

Als u automatiseringstaken of andere agenttaken wilt uitvoeren, vooral agenten die tools moeten aanroepen en online bewerkingen moeten uitvoeren, wordt het aanbevolen dat gebruikers voorrang geven aan de nieuwste en sterkere modellen om de beveiliging te verbeteren. Ze moeten ook de OpenClaw AI-robotinstellingen optimaliseren, alleen de minimale rechten verlenen en maatregelen nemen zoals sessie-isolatie en bronfiltering om de beveiliging te verbeteren.