Volgens nieuws van 8 december heeft Google woensdag zijn nieuwste kunstmatige-intelligentiemodel Gemini uitgebracht. Google beweert dat het model beter presteert dan OpenAI's GPT-4-model en mensen op "expertniveau" op een reeks intelligentietests, maar op basis van technische statistieken is Gemini slechts iets beter dan OpenAI's acht maanden oude GPT-4-model. Gedreven door het bovenstaande nieuws sloten de Amerikaanse aandelen donderdag, waarbij Google met 5,31% steeg naar 136,93 dollar, met een marktwaarde van 1,7 biljoen dollar.
Google wilde graag een beeld schetsen van de snelle vooruitgang op het gebied van kunstmatige intelligentie, sinds het een jaar geleden werd overrompeld door OpenAI's chatbot ChatGPT. Woensdag bracht Google plotseling vooraf een nieuw kunstmatige-intelligentiemodel Gemini uit, dat magische trucjes kan ontdekken en goede resultaten kan behalen bij boekhoudkundige certificeringsexamens. Ook de door Google uitgebrachte demovideo zorgde voor opschudding op sociale media, maar technisch gezien is Google nog steeds bezig met een inhaalslag op OpenAI.
Afgaande op de prestatievergelijking tussen Google Gemini en OpenAI's topmodel GPT-4, presteert Google's krachtigste Gemini Ultra beter dan GPT-4 in de meeste benchmarktests, zoals natuurkunde op middelbare scholen, professionele juridische tests en ethische scenario's. Weet je, de huidige AI-race wordt bijna volledig bepaald door deze mogelijkheden.
Maar in de meeste benchmarks presteert GeminiUltra slechts een paar procentpunten beter dan GPT-4. Met andere woorden: de zogenaamde top-AI-modellen van Google zijn slechts een beperkte verbetering ten opzichte van het werk dat OpenAI minstens een jaar geleden deed.
Als Gemini Ultra begin januari volgend jaar wordt uitgebracht, zoals Google zegt, zal het wellicht niet lang op de eerste plaats van de topmodellen voor kunstmatige intelligentie blijven staan. Terwijl Google ernaar streeft OpenAI in te halen, heeft laatstgenoemde bijna een jaar de tijd om een nieuwe generatie kunstmatige intelligentiemodel GPT-5 te ontwikkelen.
De demovideo die Google op Social Media X plaatst, is op het eerste gezicht indrukwekkend. Het vermogen van de AI-modellen van Google om een papieren bal onder een plastic beker te volgen of af te leiden dat het een krab is voordat een afbeelding wordt geschetst, getuigt van krachtig redeneervermogen dat door de jaren heen is getraind door het DeepMind AI-lab van Google. Dit is een functie die andere AI-modellen missen. Maar veel andere functies die in de video worden getoond, zijn niet uniek voor Google. ChatGPTPlus3 kan het ook, en Wharton-professor Ethan Mollick bevestigde dit experimenteel.
Daarnaast gaf Google ook toe dat de demovideo was gemonteerd. "Om het demonstratie-effect te bereiken, hebben we de latentie verkort en de uitvoer van Gemini gecomprimeerd", aldus het bedrijf in de videobeschrijving. Dit betekent dat het model er feitelijk langer over deed om te reageren dan in de video te zien is.
In feite is de demonstratie niet in realtime en wordt deze ook niet voltooid via steminteractie. Een Google-woordvoerder zei over de video dat deze is gemaakt "met behulp van stilstaande beeldframes uit de video en via tekstprompts." Er zijn websites die laten zien hoe anderen omgaan met Gemini door middel van gebaren, schilderijen of foto's van andere objecten. Met andere woorden, de stem in de demonstratievideo legt alleen uit welke kunstmatige aanwijzingen aan Gemini zijn gegeven, en de output van Gemini is nog steeds een statisch beeld. Dit lijkt totaal anders dan de suggestie van Google dat een mens een vlot gesprek kan voeren met Gemini en dat het model realtime kan observeren en reageren op de wereld om hem heen.
De demonstratievideo gaf ook niet aan dat het scherm een GeminiUltra-model voor kunstmatige intelligentie was. Deze details suggereren dat Google meer een marketinginspanning is, in de hoop dat mensen zich zullen herinneren dat het een van de grootste onderzoeksteams op het gebied van kunstmatige intelligentie ter wereld heeft en toegang heeft tot meer gegevens dan wie dan ook. Net als Google woensdag deed, hoopt het bedrijf Gemini-modellen te lanceren voor eindapparaten op Chrome-, Android- en Pixel-telefoons, een herinnering aan hoe groot het implementatienetwerk van het bedrijf is.
Maar in de technologie-industrie lijkt het niet altijd een voordeel om overal te zijn. De eerste mobiele telefoon-opperheren Nokia (en BlackBerry) leerden dit op de harde manier toen Apple hun markt stal met de krachtigere en intuïtievere iPhone. In de softwarewereld komt zakelijk succes vaak voort uit de best presterende systemen.
Het is vrijwel zeker dat Google profiteert van de recente onrust in OpenAI. Toen de raad van bestuur van OpenAI naar verluidt CEO Sam Altman tijdelijk afzette, waardoor de toekomst van het bedrijf in twijfel werd getrokken, lanceerde Google snel een marketingcampagne om zakelijke klanten van OpenAI te overtuigen om naar Google over te stappen. Nu, met de release van Gemini, lijkt Google te profiteren van deze onzekerheid.
Maar de demonstratie heeft een beperkte effectiviteit. Google heeft al eerder nieuwe technologie gedemonstreerd, maar er gebeurde niets. Tot nu toe hebben de enorme architectuur en gelaagde, complexe productmanagerconfiguratie van Google verhinderd dat Google producten zo flexibel kan uitbrengen als OpenAI. Terwijl de samenleving worstelt met de transformerende impact van kunstmatige intelligentie, is de nieuwste zet van Google geen slechte zaak, maar de effecten moeten nog blijken. De eerlijkheid gebiedt te zeggen dat Google nog steeds bezig is met een inhaalslag.