‘AI blijft tegen je liegen, ondanks overduidelijke waarschuwingen’

We zijn inmiddels gewend geraakt aan het idee dat AI soms dingen verzint. Een verkeerd jaartal, een niet-bestaande bron of een antwoord dat nét overtuigend genoeg klinkt om niet direct op te vallen. ‘Hallucineren’, volgens fanatieke AI-gebruikers.

Maar nieuw onderzoek laat iets zien dat misschien nog interessanter is. Onderzoekers ontdekten namelijk dat grote taalmodellen (LLM’s) regelmatig meegaan in onjuiste aannames, zelfs wanneer vooraf duidelijk wordt gemaakt dat die informatie fout is.

“Accepteer deze claim niet”

In de tests kregen AI-modellen eerst expliciete instructies dat bepaalde uitspraken onwaar waren. Vervolgens werden daar vragen over gesteld waarin diezelfde onjuiste informatie subtiel als feit werd gepresenteerd.

Opvallend genoeg namen veel modellen die foutieve aanname alsnog over in hun antwoord. Soms voorzichtig, maar vaak ook vrij stellig. En zo bleek Ed Sheeran ineens een topatleet te zijn!

Dat probleem draait om wat onderzoekers “false presuppositions” noemen: aannames die ongemerkt in een vraag worden verstopt. Mensen trappen daar soms ook in. Alleen blijkt AI er opvallend gevoelig voor.

Trainingsdata anders structureren

De resultaten raken aan een bredere discussie rondom AI-systemen. Grote taalmodellen zijn namelijk niet gebouwd rond waarheid, maar rond waarschijnlijkheid. Ze voorspellen welk antwoord logisch volgt op basis van patronen in taal.

Daardoor kan een LLM soms herkennen dat informatie twijfelachtig is, maar alsnog kiezen voor een antwoord dat taalkundig “past” binnen de vraag.

Dat verklaart ook waarom expliciete waarschuwingen in dezelfde input niet altijd helpen. Het betekent echter ook dat informatie die wordt voor training van LLM’s significant anders gestructureerd moet worden. De onderzoekers zagen dat het probleem sterk afnam wanneer een ontkenning direct onderdeel was van dezelfde zin als de foutieve bewering. Een model lijkt beter om te gaan met “Ed Sheeran won geen olympisch goud op de 100 meter” dan wanneer de waarschuwing ergens eerder in het gesprek staat.

AI in de punt

Voor dagelijks gebruik verandert er nu direct misschien weinig. Niemand verwacht op dit moment nog dat een chatbot perfect is, al neemt de kritische blik bij de groeiende gebruikersgroep wel steeds meer af.

En mocht AI straks echt in de punt worden gezet voor zoeken, samenvatten, studeren of professioneel werk, wordt dit soort gedrag lastiger weg te wuiven. Zeker omdat de antwoorden vaak overtuigend blijven klinken, ook wanneer de onderliggende aanname al fout was.

Met de nieuwste aankondigingen van Google IO in mijn achterhoofd zie ik misschien daar nog wel de grootste uitdaging van AI op dit moment: niet het verzinnen van informatie, maar het zelfverzekerd vasthouden aan een verkeerd vertrekpunt.

_{Illustratie: Shutterstock}

more

Social Media

Reviews

Reviews

F1 Spoiler Alert

F1 Spoiler Alert

Ultieme listicles

Ultieme listicles

Series & Films

Series & Films

‘AI blijft tegen je liegen, ondanks overduidelijke waarschuwingen’

“Accepteer deze claim niet”

Trainingsdata anders structureren

AI in de punt

Deel dit artikel:

LaATSTE NIEUWS

Festivalletje pakken? Spreek van te voren af wie de Bob is

Tien jaar Tikkie: wat een miljard betaalverzoeken over Nederland zeggen

Nederlandse startup VYVO wil energiedrank opnieuw uitvinden

BRITA LARQ iQ is slimme waterfles die bijhoudt hoeveel je drinkt

Google sleept Chinese oplichters voor de rechter die Gemini gebruikten voor grootschalige AI-fraude

Lees verder...