Laten we het vandaag hebben over de vooruitgang van Bard, het antwoord van Google op ChatGPT, en hoe het een van de meest urgente problemen met chatbots van vandaag oplost: de neiging van chatbots om dingen te verzinnen.
Vanaf het moment dat chatbots vorig jaar werden geïntroduceerd, hebben hun makers ons gewaarschuwd ze niet te vertrouwen. De tekst die wordt gegenereerd door tools als ChatGPT is niet gebaseerd op een database met vastgestelde feiten. In plaats daarvan is de chatbot voorspellend: hij doet probabilistische inschattingen over welke woorden correct lijken te zijn op basis van een groot tekstcorpus dat is getraind op het onderliggende grote taalmodel.
Als gevolg hiervan maken chatbots vaak ‘vol vertrouwen fouten’, in het vakjargon. Dit kan zelfs hoogopgeleide mensen voor de gek houden, zoals we dit jaar zagen toen een advocaat citaten indiende die waren gegenereerd door ChatGPT, zonder te beseffen dat elke zaak uit het niets was ontstaan.
Deze situatie verklaart waarom ik chatbots meestal nutteloos vind als onderzoeksassistenten. Ze vertellen je binnen enkele seconden alles wat je wilt, maar citeren in de meeste gevallen hun werk niet. Daarom moet je veel tijd besteden aan het onderzoeken of hun antwoorden waar zijn, wat vaak het doel van het gebruik van een chatbot tenietdoet.
Toen Google's Bard eerder dit jaar werd gelanceerd, bevatte het een 'GoogleIt'-knop waarmee je je zoekopdracht naar de zoekmachine van het bedrijf kon sturen. Hoewel je hierdoor sneller een second opinion kunt krijgen over de output van de chatbot, ligt de verantwoordelijkheid nog steeds bij jou om te bepalen of deze waar of onwaar is.
Maar vanaf vandaag zal Bard meer voor je doen. Nadat de chatbot een van uw vragen heeft beantwoord, klikt u op de Google-knop om uw antwoord te "bekijken". Hier is hoe het bedrijf het in een blogpost uitlegde:
Wanneer u op het pictogram "G" klikt, leest "Bard" uw antwoorden en beoordeelt of er inhoud op internet is die uw antwoorden bevestigt. Als de claim kan worden beoordeeld, kunt u op de gemarkeerde zin klikken voor meer informatie over ondersteunende of tegenstrijdige informatie die door de zoekopdracht is gevonden.
Nauwkeurige inspectie van de vraag zorgt ervoor dat veel zinnen in de antwoorden groen of bruin worden. Antwoorden gemarkeerd in een groene link naar de verwijzende webpagina; Beweeg uw muis over een van deze pagina's en Bard laat u zien waar de informatie vandaan komt. Bruin gemarkeerde antwoorden geven aan dat Bard de bron van het bericht niet kent en dat de markering mogelijk een fout is.
Toen ik bijvoorbeeld Bards antwoord op mijn vraag over de geschiedenis van de band Radiohead dubbel controleerde, leverde dat veel groen gemarkeerde zinnen op die overeenkwamen met mijn eigen kennis. Maar het maakt de zin ook bruin: "Ze hebben talloze prijzen gewonnen, waaronder zes Grammy Awards en negen Brit Awards." Beweeg over deze zin en de zoekresultaten van Google onthullen tegenstrijdige informatie; Radiohead heeft zelfs nog nooit één Brit Award gewonnen, laat staan negen.
"Ik ga je vertellen over een tragedie die in mijn leven is gebeurd", vertelde Jack Krawczyk, senior productdirecteur van Google, vorige week in een interview.
Krawczyk was thuis zwaardvis aan het koken en de geur van het kookproces leek door het hele huis te dringen. Hij gebruikte Bard om manieren op te zoeken om te ontgeuren en onderzocht vervolgens de resultaten om feiten van fictie te scheiden. Het blijkt dat een grondige schoonmaak van de keuken het probleem niet oplost, zoals de chatbot oorspronkelijk zei. Het kan echter helpen om kommen zuiveringszout in huis te bewaren.
Krawczyk vertelde me dat, omdat mensen Bard op zoveel verschillende manieren gebruiken, dubbelcontrole vaak niet nodig is. (Normaal gesproken vraagt u hem niet om een gedicht dat u heeft geschreven, of een door hem opgestelde e-mail, enz. te controleren.)
Hoewel dubbele controle een duidelijke verbetering betekent, moet u vaak nog steeds alle citaten eruit halen en ervoor zorgen dat Bard de zoekresultaten correct interpreteert. Als het om onderzoek gaat, houden mensen tenminste nog steeds de hand van AI vast, net zoals AI de onze vasthoudt.
Dit is echter een welkome ontwikkeling.
"Misschien hebben we het eerste taalmodel gecreëerd dat toegeeft dat het een fout heeft gemaakt", zei Krawczyk. "Gezien het belang van het verbeteren van deze modellen, zou het een topprioriteit moeten zijn voor de sector om ervoor te zorgen dat AI-modellen fouten nauwkeurig toegeven."
Dinsdag kreeg Bard nog een grote update: hij kan nu verbinding maken met je Gmail, Documenten, Drive en een paar andere Google-producten, waaronder YouTube en Maps. Met de zogenaamde extensie kunt u in realtime zoeken, samenvatten en vragen stellen over documenten die zijn opgeslagen in uw Google-account.
Momenteel is het beperkt tot persoonlijke accounts, wat de bruikbaarheid ervan enorm beperkt, maar als alternatieve manier om op internet te surfen is het soms leuk - toen ik het bijvoorbeeld vroeg om me een aantal geweldige video's te laten zien over hoe je aan de slag gaat met interieurontwerp, deed het geweldig werk. (Het is leuk dat deze video's online kunnen worden afgespeeld in het Bard-antwoordvenster.)