Onlangs heeft Google dit officieel bekendgemaaktZijn vlaggenschip AI-model Gemini lijdt onder door commercialisering gedreven grootschalige distillatieaanvallen, waardoor chatbots door herhaalde vragen interne mechanismen lekken. Google zei dat de aanvaller systematisch en herhaaldelijk zorgvuldig ontworpen promptwoorden naar het model stuurde (meer dan 100.000 keer in één enkele aanval) in een poging de interne redeneerlogica en het besluitvormingsmechanisme van Gemini te reverse-engineeren om modelklonen te bereiken of zijn eigen AI-systeem te versterken.

Deze aanvallen worden voornamelijk uitgevoerd door “commercieel gemotiveerde actoren”,Google oordeelde dat de mensen erachter voornamelijk particuliere AI-bedrijven of onderzoeksinstellingen waren die een concurrentievoordeel hoopten te behalen. Een woordvoerder van het bedrijf zei dat de bron van de aanval uit meerdere regio's over de hele wereld kwam, maar maakte verder geen informatie vrij..

Er wordt gemeld dat destillatie-aanval (ook bekend als kennisdestillatie) oorspronkelijk een modelcompressietechnologie is die modelverlichting bereikt door de kennis van een groot "lerarenmodel" te migreren naar een klein "studentenmodel".

De aanvaller verzamelt de antwoorden van het model in verschillende scenario's door middel van systematische en gestructureerde grote vragen, analyseert subtiele verschillen zoals antwoordinhoud, vertraging en vertrouwen, en bouwt Gemini's beslissingsgrenzen en redeneerpadenkaart op.Ten slotte worden de verzamelde responsgegevens gebruikt om zijn eigen ‘studentenmodel’ te trainen om de kerncapaciteiten van Gemini te repliceren..

Google zei dat dergelijke distillatie-aanvallen diefstal van intellectueel eigendom zijn, hoewel grote fabrikanten mechanismen hebben ingezet die distillatie-aanvallen kunnen identificeren en blokkeren.Maar omdat reguliere grote modeldiensten voor iedereen openstaan, zijn ze nog steeds inherent kwetsbaar..