Een gewaarschuwd algoritme telt voor twee. Een prima 2026-versie van het bekende gezegde. Maar helaas ver van de waarheid, zo blijkt. Onderzoekers ontdekten dat grote AI-modellen zich verrassend makkelijk laten meeslepen door onjuiste aannames, zelfs wanneer expliciet wordt verteld dat een bewering niet klopt.
We zijn inmiddels gewend geraakt aan het idee dat AI soms dingen verzint. Een verkeerd jaartal, een niet-bestaande bron of een antwoord dat nét overtuigend genoeg klinkt om niet direct op te vallen. ‘Hallucineren’, volgens fanatieke AI-gebruikers.
Maar nieuw onderzoek laat iets zien dat misschien nog interessanter is. Onderzoekers ontdekten namelijk dat grote taalmodellen (LLM’s) regelmatig meegaan in onjuiste aannames, zelfs wanneer vooraf duidelijk wordt gemaakt dat die informatie fout is.
“Accepteer deze claim niet”
In de tests kregen AI-modellen eerst expliciete instructies dat bepaalde uitspraken onwaar waren. Vervolgens werden daar vragen over gesteld waarin diezelfde onjuiste informatie subtiel als feit werd gepresenteerd.
Opvallend genoeg namen veel modellen die foutieve aanname alsnog over in hun antwoord. Soms voorzichtig, maar vaak ook vrij stellig. En zo bleek Ed Sheeran ineens een topatleet te zijn!

Dat probleem draait om wat onderzoekers “false presuppositions” noemen: aannames die ongemerkt in een vraag worden verstopt. Mensen trappen daar soms ook in. Alleen blijkt AI er opvallend gevoelig voor.
Trainingsdata anders structureren
De resultaten raken aan een bredere discussie rondom AI-systemen. Grote taalmodellen zijn namelijk niet gebouwd rond waarheid, maar rond waarschijnlijkheid. Ze voorspellen welk antwoord logisch volgt op basis van patronen in taal.
Daardoor kan een LLM soms herkennen dat informatie twijfelachtig is, maar alsnog kiezen voor een antwoord dat taalkundig “past” binnen de vraag.
Dat verklaart ook waarom expliciete waarschuwingen in dezelfde input niet altijd helpen. Het betekent echter ook dat informatie die wordt voor training van LLM’s significant anders gestructureerd moet worden. De onderzoekers zagen dat het probleem sterk afnam wanneer een ontkenning direct onderdeel was van dezelfde zin als de foutieve bewering. Een model lijkt beter om te gaan met “Ed Sheeran won geen olympisch goud op de 100 meter” dan wanneer de waarschuwing ergens eerder in het gesprek staat.
AI in de punt
Voor dagelijks gebruik verandert er nu direct misschien weinig. Niemand verwacht op dit moment nog dat een chatbot perfect is, al neemt de kritische blik bij de groeiende gebruikersgroep wel steeds meer af.
En mocht AI straks echt in de punt worden gezet voor zoeken, samenvatten, studeren of professioneel werk, wordt dit soort gedrag lastiger weg te wuiven. Zeker omdat de antwoorden vaak overtuigend blijven klinken, ook wanneer de onderliggende aanname al fout was.
Met de nieuwste aankondigingen van Google IO in mijn achterhoofd zie ik misschien daar nog wel de grootste uitdaging van AI op dit moment: niet het verzinnen van informatie, maar het zelfverzekerd vasthouden aan een verkeerd vertrekpunt.
Illustratie: Shutterstock








