Ionica Smeets

Hoogleraar wetenschapscommunicatie – Universiteit Leiden

  • Zoek de overeenkomst tussen deze recente nieuwskoppen: Trump bereidt VS voor op ‘waarschijnlijk meer’ Amerikaanse doden. Zorgwekkend megalek bij Odido leidt waarschijnlijk niet direct tot meer fraude. Denzel Washington waarschijnlijk niet de enige gevierde veteraan in Black Panther 3. Deze uitgefikte Ferrari 360 is waarschijnlijk aangestoken. Kunstdetective Arthur Brand vreest het ergste: ‘Gestolen Merijntje Gijzen waarschijnlijk al omgesmolten.’

    Vijf keer staat er het woord waarschijnlijk. Betekent dit woord in al die zinnen hetzelfde? Waarschijnlijk niet.

    Een paar jaar terug onderzocht ik met statistici Casper Albers en Sanne Willems hoe mensen kanswoorden als vaak, misschien en waarschijnlijk vertalen naar een percentage. Hierbij maakt de context waarin zo’n woord staat nogal veel uit. ‘Waarschijnlijk regent het vandaag in Barcelona’ is bijna dezelfde zin als ‘Waarschijnlijk regent het vandaag in Edinburgh’, maar de meeste mensen zullen die twee waarschijnlijks anders interpreteren, omdat ze weten dat het in Barcelona minder vaak regent dan in Edinburgh.

    Wij gebruikten in ons onderzoek daarom kleurloze zinnetjes als ‘Deze behandeling slaagt vaak’ en ‘Deze partij wordt misschien de grootste’. Wij vonden dat mensen waarschijnlijk interpreteerden als een kans van ergens tussen de 75 en 91 procent. Waarschijnlijk is daarmee een nogal onprecieze term, met allerlei interpretaties. Die vaagheid is vaak juist de reden om dit soort termen te gebruiken, hiermee maak je duidelijk dat je iets ongeveer weet. Maar om misverstanden te voorkomen is het slim om daarnaast toch ook de kans in getallen te melden.

    Vorige maand verscheen een studie waarin Amerikaanse onderzoekers keken hoe AI-taalmodellen dit soort kanswoorden interpreteren. Ze deden dat in het Chinees en in het Engels. De meeste weken nogal af van hoe mensen dit soort woorden lezen. Het meest verrassende van deze studie vond ik dat de AI-modellen veel minder onzekerheid gaven bij uitspraken die specifiek over mannen of vrouwen gingen. Is het een mens dat iets likely gaat doen, dan geven de taalmodellen aan dat de kans ergens tussen de 75 en 85 procent ligt.

    Is het specifiek een man of specifiek een vrouw, dan is de kans ineens precies 80 procent. De onderzoekers vermoeden dat de (wenselijke) spreiding in interpretatie verdwijnt, omdat de modellen zijn getraind op data met stellige vooroordelen over hoe mannen of vrouwen zich gedragen. Ze bepleiten daarnaast dat het belangrijk is dat taalmodellen in de toekomst dezelfde kansen consistent met hetzelfde woord aanduiden.

    Maar waarom zou dat moeten als mensen dat ook niet doen? De hele crux van deze taalmodellen is bovendien dat ze geen correcte teksten maken, maar waarschijnlijke. Onzekerheid en vaagheid zitten al ingebakken in de resultaten. Felienne Hermans muntte het prachtige woord ongevirus voor ‘blind enthousiasme voor AI dat zich, mogelijk met kwalijke gevolgen, snel onder mensen verspreidt, ondanks het feit dat AI vaak informatie geeft die wel ongeveer maar niet precies klopt’. Ik ben benieuwd hoe mensen dát woord interpreteren.

    Deze column verscheen op 6 maart 2026 in de Volkskrant.

  • Samen met mijn kinderen keek ik naar Rob Jetten met zijn nieuwe kabinet op het bordes. Een premier van 38, wat een jeugdig elan! Ik dacht terug aan Ruud Lubbers, de eerste premier die ik als kind bewust meemaakte. In mijn herinnering was hij toen een héél oude man.

    Deze week ontdekte ik dat Ruud Lubbers toen hij in november 1982 aantrad de jongste premier ooit was: hij was slechts 43 (drie jaar jonger dan ik op dit moment). Jan Blokker zag destijds helemaal niets in Lubbers’ CDA-VVD-kabinet en voorspelde in deze krant dat de jonge ploeg snel zou vallen: ‘Vermoedelijk kan Ruud de crisis nog over de zomervakantie heen tillen – maar stel je voor, volgend jaar om deze tijd eindelijk weer eens een stokoud rooms-rood kabinet!’ Blokker kreeg ongelijk, kabinet-Lubbers I maakte de volledige termijn vol en Lubbers bleef uiteindelijk tot 1994 premier. Hij was 55 toen Wim Kok het overnam.

    Is dat waarom Lubbers in mijn herinnering veel ouder is dan Jetten nu, dat ik me hem vooral aan het eind van zijn premierschap herinner, als vijftiger? Het speelt vast mee, maar ik vermoed dat iets anders belangrijker is.

    Rob Jetten is de eerste premier die ik meemaak die jonger is dan ik. Slimme lezers hebben uit de tweede alinea al geconcludeerd dat ik nu 46 ben. Jan Peter Balkenende was ook 46 toen hij premier werd, Mark Rutte was 43. Van de achttien naoorlogse premiers waren er zes 46 of jonger toen ze aantraden. Alleen was ik toen zelf een stuk jonger (of nog niet eens geboren).

    En dat geldt voor iedereen die dit leest: u bent nog nooit zo oud geweest toen er een nieuwe premier begon als deze week toen Rob Jetten begon. Waar ieder van ons langzaam maar zeker monotoon stijgend ouder wordt, is de leeftijd van ‘de premier’ een veel grilligere grafiek.

    Ik heb die grafiek voor u gemaakt. Om af te zijn van gedoe met precieze data van aantreden en verjaardagen, nam ik op 31 december van alle jaren sinds 1945 de leeftijd van de toenmalige premier. Hierbij nam ik de gok dat Rob Jetten op 31 december 2026 nog premier zal zijn. Ik hoop dat hij dat haalt, en niet alleen omdat mijn grafiek anders niet meer klopt.

    In deze grafiek tekende ik ook mijn eigen leeftijd op alle 31 decembers dat ik er was. Kijk hoe groot de afstand in leeftijd tussen mij en de premiers jarenlang was, hoe ik langzaam naar ze toekroop en nu voor het eerst boven de premier zit. Terwijl veel premiers in het verleden wel degelijk jonger waren dan ik nu. Doe thuis gerust hetzelfde voor uw eigen leven en denk na over het wonder van de tijd, over oude mensen, de dingen die voorbijgaan.

    Afbeelding van de Volkskrant.

    Deze column verscheen op 27 februari 2026 in de Volkskrant.

  • Ik was een paar dagen gevloerd door de griep. Nadat de koorts was gezakt, kroop ik onder mijn dekentje vandaan en opende voorzichtig mijn inbox. Daar trof ik, hoe toepasselijk, een vraag over de griepepidemie. Lezer Simone Thewissen had op nu.nl gelezen ‘dat de grenswaarde waarboven wordt gesproken van een griepepidemie elk jaar opnieuw wordt vastgesteld’. Zij had hier veel vragen bij: ‘Hoe kan dat? Als je een definitie hebt, ligt die toch vast? Waarom is de grenswaarde niet constant?’

    Dit jaar is de grenswaarde voor een griepepidemie bereikt als twee weken achter elkaar 46 van 100.000 mensen zich met griepklachten melden bij een huisarts. Vorig jaar was dat 53, in de winter van 2020-2021 nog 58 en in 2017-2018 was het 51 op de 100.000 mensen.

    Het RIVM heeft een pagina met de heerlijke titel ‘Actualiteiten over griep waar elke woensdag de nieuwste griepcijfers verschijnen. Zo bezochten vorige week 59 op de 100.000 mensen de huisarts met griepachtige klachten en de week ervoor waren dat er 51 op de 100.000. Daarmee zaten we twee weken boven de grenswaarde van dit jaar (die was 46) en dus was er nu sprake van een griepepidemie. Daar had ik deel van uitgemaakt!

    De pagina bevat nog veel meer achtergrondinformatie: bijvoorbeeld over hoe vaak het griepvirus was aangetoond in keel-en-neusmonsters, allerlei definities en grafiekjes met het verloop van griepmeldingen. Ook bij onderzoeksinstituut Nivel, dat de griepcijfers levert, staat een schat aan informatie en cijfers. Zo duurde de langste gemeten griepepidemie maar liefst 21 weken, dat was tijdens de winter van 2014-2015 (technisch gezien duurde die epidemie dus langer dan die winter). Maar wat ik nergens kan vinden, is waarom die grenswaarde elk jaar anders is.

    De volgende dag vraag ik tijdens een werklunch aan een collega van het LUMC of zij dat misschien weet. Het is niet haar vakgebied, maar ze gooit mijn vraag in een overleggroep met collega’s. Binnen tien minuten heb ik dankzij huisarts-onderzoeker Hanneke Borgdorff een document van het Nivel dat uitlegt hoe de grenswaarden tot stand komen.

    En dan valt het kwartje: de grenswaarde is voor ‘griepachtige klachten gemeld bij de huisarts’ en dat aantal kan op allerlei manieren verschillen van het aantal daadwerkelijke griepgevallen. Zo worden lang niet alle grieppatiënten geregistreerd. Ik denk dat ik vorige week griep had, maar ik heb me niet gemeld bij een huisarts. Andersom kunnen zich ook patiënten met griepachtige klachten bij een huisarts melden, die helemaal géén griep hebben, maar ziek zijn geworden van iets anders. Daarom wordt bij een deel van de patiënten monsters afgenomen om te testen welke griepvirussen er rondgaan.

    Griepvirussen hebben elk jaar andere eigenschappen: soms maken ze mensen zieker en dan zullen meer van de mensen die griep krijgen zich melden bij de huisarts. Maar er kunnen ook juist relatief veel andere virussen rondgaan (ik noem geen voorbeelden, maar klop even af op ongeverfd hout dat we nog eens een pandemie krijgen). Borgdorff legt uit dat de grenswaarde bepaald wordt aan de hand van de gegevens van de afgelopen jaren: ‘Dus als de grenswaarde dit jaar laag is, zegt dat iets over de griepepidemie van afgelopen jaren, en niet zozeer over deze epidemie.’

    Kortom: de grenswaarde moet elk jaar anders zijn, om te zorgen dat de gemelde griepklachten zich vertalen naar hetzelfde geschatte niveau van echte griepgevallen.

    Deze column verscheen op 20 februari 2026 in de Volkskrant.

  • Hoe kijken mbo-studenten naar misleidende grafieken en welke soort correctie helpt hen het meeste? Maandag verscheen een wetenschappelijk artikel waarin ik samen met drie collega’s deze vragen beantwoord.

    In oktober 2020 verdedigde ik het onderzoeksplan achter deze studie tegenover een commissie. Een van hen vroeg of het niet wat weinig ambitieus was om slechts twee wetenschappelijke publicaties te plannen binnen een project van twee jaar. Ik antwoordde verbouwereerd dat twee jaar me eerder aan de krappe kant leek voor onze plannen. Het was maar goed dat ik destijds nog niet wist dat dit project uiteindelijk bijna zes jaar zou duren.

    Het begon in voorjaar 2020. Terwijl de wereld in lockdown ging, schreef het Leids Universiteits Fonds een lustrumsubsidie uit voor onderzoekers uit verschillende vakgebieden. Peter Burger van journalistiek en mediastudies was een expert op het gebied van het bestrijden van misinformatie met wie ik eerder misleidend gezondheidsnieuws onderzocht. Sanne Willems was een statisticus met wie ik een studie deed over het communiceren van kansen. Samen wilden we onderzoeken hoe je misleidende grafieken het beste kunt corrigeren.

    Tijdens corona wemelde het van de misleidende grafieken. We kregen de subsidie, hielden in januari 2021 (opnieuw in lockdown) online sollicitatiegesprekken met kandidaten die dit project zouden kunnen uitvoeren. In april begon Winnifred Wijnker, die een achtergrond in visuele communicatie meebracht. Het project kreeg een looptijd van ruim drie jaar, omdat Winnifred het onderzoek combineerde met andere taken. In december 2022 verscheen, keurig op schema, onze eerste studie (naar verschillende manieren voor het corrigeren van misleidende grafieken).

    Uit onze data volgde dat mensen met een praktische opleiding gevoeliger leken voor misleidende grafieken. We besloten onze tweede studie daarom te richten op jonge mbo’ers, een groep die ondervertegenwoordigd is in wetenschappelijk onderzoek (terwijl er juist veel onderzoek gedaan wordt onder universitaire studenten).

    We legden contact met mbo-docenten, wachtten op de ethische commissie en pre-registreerden onze studie. In april 2023 verzamelden we data op een aantal mbo’s. Helaas bleek een deel daarvan onbruikbaar, dus gingen we over op plan B: een organisatie inhuren die ons onderzoek onder jonge mbo’ers zou verspreiden. Die organisatie ontdekte dat het meer tijd kostte om jonge mbo’ers te bereiken dan verwacht. In oktober hadden we eindelijk de complete data. In december liep het project af. Winnifred vertrok naar de Hogeschool Utrecht. Intussen had ons project wel allerlei mooie bijvangst opgeleverd: drie verschillendelespakkettende grafiekpolitie (een website met artikelen over dubieuze grafieken in de media) en een studie met Zuid-Afrikaanse grafiekenonderzoekers.

    Alleen dat geplande tweede artikel moesten we nog afmaken, ook al werkte Winnifred elders. In april 2024 dienden we het in bij een psychologisch vaktijdschrift. Het werd zonder reviews afgewezen. We dienden het in bij een ander tijdschrift. Ook hier werd het zonder reviews afgewezen door een redacteur die niet snapte wat het mbo is. ‘Het meeste onderzoek wordt gedaan onder studenten, waarom zou het voor jullie studie uitmaken of ze een beroep hebben gekozen?’

    Poster bij het wetenschappelijk artikel Debunking misleading graphs effectively: How vocationally educated young adults perceive graphs.

    In juli 2024 stuurden we ons werk opnieuw op, deze keer naar tijdschrift Plos One. Driemaal bleek scheepsrecht, want daar werd het artikel geaccepteerd, al kostten de twee rondes peerreview uiteindelijk anderhalf jaar. Ik herhaal even: anderhalf jaar! We hebben eindeloos moeten wachten, maar toen het artikel vorige week klaar was, kregen wij 48 uur om de proeven te controleren. En zo werd het na zes jaar toch weer haasten.

    Deze column verscheen op 13 februari 2026 in de Volkskrant.