Categorie: Column

Ik moest schatten wat de kans op deze buikpijn was als mijn spiraal níét door mijn baarmoeder was ­gegaan

Met Kerst kreeg ik buikpijn. Tijdens het kerstdiner zocht ik op thuisarts.nl naar de symptomen van blindedarmontsteking. Maar de pijn was anders, het leken wel weeën. Was dit een extreme vorm van menstruatiepijn? Op maandag belde ik mijn huisarts om te vragen of die buikpijn iets te maken kon hebben met mijn nieuwe spiraaltje dat begin december geplaatst was.

Hij wilde me onmiddellijk zien en even later bleken de touwtjes van mijn spiraal verdwenen. Voorzichtig vertelde mijn huisarts me dat er een kans van 1 op 1000 was dat de spiraal bij het plaatsen mijn baarmoederwand had geperforeerd. En dat hij daarna in mijn buikholte kon zijn beland. Ondanks corona en kerstvakantie kon ik gelijk door naar het ziekenhuis voor een echo.

Terwijl ik naar het ziekenhuis fietste, dacht ik na over die 1 op 1000. Best een grote kans eigenlijk.

En dat was de kans dat het überhaupt misging bij plaatsing, maar gegeven dat ik nu pijn had was die kans waarschijnlijk een stuk groter. Om mezelf af te leiden, besloot ik die kans uit te rekenen met de stelling van Bayes.

Daarvoor moest ik nog twee kansen schatten. Als eerste de kans dat ik buikpijn zou krijgen als de spiraal mijn baarmoeder geperforeerd had. Die leek me nogal groot, al schenen er ook vrouwen te zijn die dit niet eens merkten: ik zette hem op 90 procent. Ook moest ik schatten wat de kans op deze buikpijn was als mijn spiraal níét door mijn baarmoeder was gegaan. Ik besloot die op één op duizend te zetten, omdat de pijn zo raar en heftig was. De stelling van Bayes leverde op dat met mijn buikpijn de kans op een geperforeerde baarmoeder zo’n 47 procent was.

De gynaecoloog bleek een stuk optimistischer. Waarschijnlijk zat mijn spiraal gewoon wat dieper in mijn baarmoeder, dat kwam vaak voor. Maar bij de echo kon hij hem niet vinden. Hij bleef optimistisch: misschien was ik mijn spiraal ongemerkt verloren, dat kon blijkbaar ook nog. Een röntgenfoto zou zekerheid geven.

Terwijl ik door een verlaten ziekenhuis liep, overwoog ik mijn berekening bij te werken met de nieuwe informatie. Maar voordat ik dat kon doen, was de foto al genomen en verder rekenwerk overbodig. Mijn spiraal was duidelijk zichtbaar – en hij zat niet in mijn baarmoeder. Er werd een operatie gepland om hem eruit te vissen. De tussentijd kwam ik door met stapels paracetamol, Agatha Christie en bange berekeningen voor de kans dat de operatie vanwege corona zou worden uitgesteld.

Inmiddels is de spiraal succesvol verwijderd. Hij bleek in de holte van Douglas te zijn beland, een ruimte tussen je baarmoeder en endeldarm. Ik had er nog nooit van gehoord (zo leer je nog eens wat), maar het bleek de plek waar ruim de helft van de verdwenen spiraaltjes opduikt. Bij de operatie is ook gelijk een nieuw spiraaltje geplaatst en gekeken of die goed zat. Er is me verzekerd dat de kans echt héél klein is dat die alsnog door mijn baarmoederwand heen gaat.

Deze column verscheen op 15 januari 2021 in de Volkskrant.

Mijn inzicht van 2020: je doet het altijd fout als wetenschapper in een talkshow

Presentator: ‘Vanavond een debat tussen hoogleraar wetenschapscommunicatie Smeets, die vindt dat wetenschappers niet zo vaak moeten aanschuiven in talkshows, en Volkskrant-columnist Ionica die juist denkt dat wetenschappers zich méér in het publiek debat moeten mengen. Goedenavond!’

Smeets: ‘Mag ik beginnen met zeggen dat ik het nogal ongemakkelijk vind om hier te zitten? Als wetenschapper heb ik het liever niet over mijn mening en ik denk dat collega’s daar ook voorzichtig mee moeten zijn. Je kunt je als expert veel beter houden bij het geven van zo goed mogelijke informatie en eerlijk aangeven welke dingen je níét weet.’

Ionica: ‘Ha, jij zou vanuit jouw vakgebied toch moeten weten dat feiten geven nou niet de meest effectieve communicatiestrategie is. Dat werd dit jaar duidelijker dan ooit met alle onzin die rondging over corona. Je komt in een talkshow niet ver met die eerlijkheid en nuances van jou. Zeker niet als je tegenover zelfverklaarde deskundigen zit die 100 procent zeker weten dat hun flauwekultheorie klopt. En daarvoor alle ruimte krijgen van de presentator.’

Presentator: ‘Ho ho, hou mij erbuiten graag. Ik stel alleen de vragen. Professor Smeets, het is dus uw schuld dat het zo misgaat?’

Smeets: ‘Wat? Kom nou, zeg. Wij wetenschappers moeten dingen onderzoeken en ons werk zo goed mogelijk uitleggen. Maar we weten ook heel veel niet. In talkshows als deze stelt de presentator soms de raarste vragen aan wetenschappers – alsof ze een soort orakels zijn. Het is gevaarlijk om dan maar een beetje mee te kletsen, dan kun je beter je mond houden.’

Ionica: ‘O, dus werkelijk iedereen mag zich in zo’n debat mengen, behalve wetenschappers? Dat zijn toch ook gewoon mensen met gevoelens en ideeën over hoe de samenleving zou moeten zijn?’

Smeets: ‘Natuurlijk, maar als ik als hoogleraar bij een talkshow zit, dan lijkt het alsof ik namens de wetenschap praat, ook als ik mijn mening geef over iets waarvan ik net zoveel weet als de gemiddelde kijker. Als ik dan spontaan iets zeg dat niet helemaal klopt, dan denken mensen daarna dat die wetenschappers niet te vertrouwen zijn. Bovendien hebben tv-programma’s het liefst twee gasten die het met elkaar oneens zijn, ook al is in werkelijkheid 95 procent van de mensen het met elkaar eens.’

Presentator: ‘Ja, nou wordt-ie helemaal mooi. Alsof het mijn schuld is! Het zou nogal een saai gesprek worden als er hier twee mensen zaten die het de hele tijd met elkaar eens waren. Dit is verdorie geen column.’

Ionica: ‘Maar professor Smeets heeft wel gelijk, ze kan het eigenlijk nooit goed doen.’

Smeets: ‘Dat was precies mijn inzicht van 2020: je doet het altijd fout als wetenschapper in een talkshow. Als je inzet op informeren, sta je machteloos. Maar ga je verder dan informeren en geef je daarbij een mening, dan doet dat afbreuk aan je geloofwaardigheid.’

Ionica: ‘Ha, dan zijn wij het dus tóch met elkaar eens. Al vind ik dat je desondanks als wetenschapper toch gewoon in talkshows moet aanschuiven. Want als je níét gaat, is het nog slechter voor het debat.’

Smeets: ‘Ja, dat ben ik denk ik wel met je eens.’

Presentator: ‘Mooi! We gaan zo door naar Peter R. de Vries. Maar nog even, professor Smeets, wat vindt u nu eigenlijk van de Deventer moordzaak?’

Deze column verscheen op 23 december 2020 in de Volkskrant.

Achter alle coronagrafieken zitten allerlei keuzen die veel uitmaken voor hoe mensen ze lezen

Hoe zet je al die duizelingwekkende coronacijfers in grafieken? Ik krijg geregeld mails van lezers die klagen over een grafiek die ze ergens hebben gezien. Er gaat inderdaad heel wat mis, bijvoorbeeld het in één grafiek direct vergelijken van totale aantallen besmettingen tussen landen, waarbij het ene land 17 miljoen inwoners heeft en het andere 1,4 miljard. Het is dan bijvoorbeeld veel eerlijker om de besmettingen per 100.000 inwoners te vergelijken.

Achter alle coronagrafieken die vrijwel elke dag in deze krant staan, zitten allerlei kleine keuzen die veel uitmaken voor hoe mensen de grafieken lezen. En vaak is helemaal niet zo duidelijk wat de beste keuzen zijn. Als je het verloop van de pandemie in verschillende landen laat zien, begin je dan overal op dezelfde datum, of start je per land op het moment dat de uitbraak daar begon? Ik zou zelf het tweede doen, maar voor het eerste is ook wel iets te zeggen.

Een veel fundamentelere keuze is de vraag welke soort schaal je gebruikt voor iets dat exponentieel groeit, zoals een corona-uitbraak. Veel data-experts en handboeken vinden dat je bij dit soort snel stijgende data een logaritmische schaal moet gebruiken waarbij intervallen op de y-as steeds groter worden. Hieronder staat bijvoorbeeld het totaal aantal coronabesmettingen per 100.000 inwoners in vier landen op zo’n logaritmische schaal.

Wat kun je op basis van deze grafiek zeggen over de ontwikkelingen in deze vier landen de laatste weken? Niet zo veel eigenlijk, het zit allemaal nogal op elkaar gepakt. Hieronder zie je ook dezelfde gegevens, maar nu op een ‘gewone’, lineaire schaal.

Persoonlijk vind ik deze grafiek een stuk makkelijker te interpreteren. En ik ben niet de enige. Een recente Amerikaanse studie liet zien dat mensen die coronagrafieken kregen op een logaritmische in plaats van een lineaire schaal, veel meer moeite hadden met het aflezen in welke week de grootste stijging was en het realistisch voorspellen van hoe de pandemie zich op korte termijn zou ontwikkelen.

Kortom: het is jammer voor de data-experts en handboeken, maar de lineaire schaal wint het dus in dit geval. Het gaat er bij dit soort keuzen namelijk niet om wat experts de beste manier vinden om de data te laten zien, het gaat er om hoe lezers het makkelijkst de informatie die ze nodig hebben uit een grafiek kunnen halen.

Deze column verscheen op 4 december 2020 in de Volkskrant.

Ouder 63, kind 36 jaar. Hoe groot is de kans op zo’n vrolijkmakende spiegelbeeldleeftijd?

Deze week hier wat luchtig rekenwerk tussen alle verdriet en moeilijke dingen door. Het is een lezersvraag die ik de afgelopen jaren tientallen keren kreeg in allerlei varianten, bijvoorbeeld deze: ‘Mijn zoon is 36 en ik ben 63. We vinden het heel grappig dat onze leeftijden het omgekeerde van elkaar zijn. En dat gebeurt vaker! Toen hij 25 was, was ik 52, jaren eerder hadden we ook al de combinatie 14 en 41. We hopen hierna 47 en 74 te halen, en 58 en 85 en heel misschien zelfs 69 en 96. Maar is het niet bijzonder dat we dit zo hebben? En zit hier één of ander wiskundig principe achter?’

Er zijn verschillende rijtjes leeftijden die dit grappige verschijnsel van terugkerende spiegelbeeldgetallen opleveren. Ook vanuit bijvoorbeeld 35 en 53 of 37 en 73 kun je hele rijtjes spiegelbeeldleeftijden maken door steeds elf jaar voor- of achteruit te schuiven.

Dat is element 1 van dit verschijnsel: als je eenmaal een spiegelleeftijd hebt met iemand, dan heb je dat elf jaar later weer (totdat een van jullie ouder dan 100 wordt). Dat is natuurlijk niet zo gek, want 11 optellen bij zulke leeftijden, maakt domweg elk van de twee cijfers ééntje groter. In de elf jaar dat de één bijvoorbeeld van 63 naar 74 gaat, gaat de ander met de spiegelbeeldleeftijd van 36 naar 47.

Het tweede wiskundige element van dit verschijnsel is dat de twee spiegelleeftijden altijd een negenvoud schelen. Iets wat veel lezers ook hadden opgemerkt. Ik weet niet hoe ik dat verschijnsel het beste in woorden kan beschrijven, maar in formules is het heel elegant. Wie daar geen zin in heeft, kan de volgende paragraaf overslaan en door naar de vraag hoe zeldzaam dit verschijnsel is.

Als je twee spiegelbeeldgetallen onder de honderd neemt, dan kun je die schrijven als ab en ba.

Dat staat dan voor

ab = 10 x a + b

ba = 10 x b + a

Het verschil tussen deze twee getallen is

ab-ba = 10 x a+ b – (10 x b+a) = 9 x a – 9 x b = 9 x (a-b)

En dat is dus altijd een veelvoud van 9, want a-b is een geheel getal.

Tot zover de wiskundige principes achter dit vrolijkmakende verschijnsel. Hoe bijzonder is het als je dit hebt in een gezin? Ik herinnerde me ineens dat onze koning Willem-Alexander 51 was toen zijn dochter Amalia 15 werd. Hij was 36 toen zij geboren werd en zij zitten dus ook in zo’n elfjaarlijks spiegelpatroon. Zelf was ik 35 toen mijn dochter Rifka geboren werd, maar wij zitten óók in zo’n patroon. Want als zij 15 is, dan word ik (hopelijk) 51. De truc werkt dus ook als je een negenvoud min één in leeftijd scheelt.

Daarmee is de kans voor twee mensen om in zo’n spiegelpatroon te komen twee op negen. Als je een gezin van vier personen hebt, dan is de kans dat daarbinnen minstens één duo in een spiegelpatroon zit 78 procent. Het verschijnsel is dus helemaal niet zo zeldzaam, maar dat maakt het niet minder bijzonder. Zoek vooral iemand die u graag mag en waarmee u elke elf jaar qua leeftijd in spiegelbeeld bent en geniet daar dan samen van.

Deze column verscheen op 2 oktober 2020 in de Volkskrant.

Op klompen in twee maten rennen om te zien welke maat de beste is: er is veel dat mij hieraan verbaast

Was me dat even een merkwaardige studie die klinisch fysicus Jeroen Verbunt me tipte. Voor een wetenschappelijk onderzoek renden Amsterdamse zorgmedewerkers op klompen door de gang van het ziekenhuis. De ene helft moest daarbij maat 38 dragen, de andere helft maat 47 en deze groepen waren willekeurig ingedeeld zodat de onderzoekers keurig konden bepalen welke schoenmaat de beste is.

Intensivecare-arts Paul Elbers beschrijft met zijn collega’s waarom dit onderzoek zo belangrijk is: goede klompen zijn cruciaal op de intensive care. Die moeten goed zitten, zeker als je naar een spoedgeval rent. Hun onderzoek laat overtuigend zien dat maat 38 beter werkt dan maat 47, want daarmee waren deelnemers gemiddeld sneller de gang door. Elbers en consorten schrijven dan ook dat ze verwachten dat maat 38 als gouden standaard in de gezondheidszorg wordt ingevoerd.

Net als de moed je in je schoenen begint te zinken over het niveau van de hedendaagse wetenschap, blijkt wat de echte bedoeling is van hun onderzoek. De onderzoekers geven schoorvoetend toe dat er een kleine kans is dat hun experiment misschien niet helemaal eerlijk was opgezet. Zowel hun interventie- als hun controlegroep zijn niet zo representatief voor hoe het echt gaat in de praktijk. Normaal dragen zorgmedewerkers namelijk gewoon klompen in hun eigen schoenmaat.

Het doel van dit artikel is om te waarschuwen voor dit soort methodologische fouten: zo’n knullige onderzoeksopzet geeft een resultaat waar je in de praktijk helemaal niets aan hebt. De auteurs noemen fijntjes een hele reeks serieuze medische studies die precies zo’n opzet hebben gevolgd met het vergelijken van een ‘lage’ en ‘hoge’ waarde. Bijvoorbeeld een behandeling voor een shocklong met als instelling 6ml/kg of 12 ml/kg. Ik weet ook niet wat dat betekent, maar blijkbaar is dat net zoiets als klompen in maat 38 of 47 met elkaar vergelijken.

Het klompenartikel is gepubliceerd onder het trefwoord ‘covid-19’ (oftewel coronavirus) – wat goed nieuws is voor u, want daardoor is het artikel voor iedereen gratis te lezen in het covid-19-archief van Elsevier. De laatste alinea van het artikel vermeldt echter dat het belangrijk is om op te merken dat deze studie he-le-maal niets te maken heeft met covid-19. De auteurs schrijven dat ze het trefwoord covid-19 alleen toevoegden om de kans op een snelle publicatie te vergroten (en vermoedelijk ook om aan te geven dat lang niet al het gepubliceerde corona-onderzoek even hoogstaand is). Nu breekt mijn klomp – zoals de auteurs zelf ook vrolijk als laatste zin opschrijven.

Er is veel dat mij hieraan verbaast. Dat dit artikel door het proces van peer-review kwam. Dat Elsevier het trefwoord ‘covid-19’ accepteerde. Dat het nodig was om uit te leggen dat zo’n onderzoeksopzet een dom idee is. Dat de onderzoekers daarvoor echt de moeite namen om mensen op twee maten klompen door de gang te laten rennen. Maar het meest van alles verbaast het me dat ik zelf nooit op het idee ben gekomen om dit soort kritiek in de vorm van een krankzinnig wetenschappelijk artikel te gieten.

Deze column verscheen op 11 september 2020 in de Volkskrant.

64 is het lievelingsgetal van mijn zoontje en waarschijnlijk het eindpunt van mijn moeder

Het was een mooie nazomerdag in 2012. Mijn moeder en ik zaten in een parkje in Zwolle, mijn zoon van 1,5 scharrelde om ons heen om steentjes te verzamelen. De avond ervoor had ik mijn moeder meegenomen naar de Librije – om nog één keer heel lekker te eten voor zij aan haar chemokuren begon. Ze had borstkanker en haar borst was eerder die zomer weggehaald. Dat was verbazingwekkend soepel gegaan, mijn moeder lag na de operatie grapjes makend in het ziekenhuisbed. En toen de arts een paar dagen later belde om te zeggen dat ze snel een beha moest dragen om te voorkomen dat het gewicht van haar andere borst aan de wond zou trekken, moest ze schaterlachen. Een van de voordelen van een kleine cup A was dat je borst niet zo snel een hinderlijk gewicht werd.

We waren optimistisch die zonnige dag in Zwolle. Die chemo zou niet leuk worden, maar mijn moeder was net 56 en heel gezond (op die stomme kanker na). Ze zou er vast goed uitkomen. Dat viel tegen. Mijn moeder kreeg tijdens de chemokuren naast alle nare lichamelijke bijwerkingen ook enorme angstaanvallen. De oncoloog zei doodleuk dat zij er was voor het bestrijden van de kanker en niet voor hoe de patiënt zich voelde. Pas jaren later hoorden we dat die angstaanvallen waarschijnlijk een bijwerking waren van medicijnen die ze tijdens de chemo kreeg. Mijn moeder maakte de kuur af – op haar tandvlees. De kanker leek weg, maar ze had veel ingeleverd en de angsten bleven. Ze moest stoppen met haar werk in haar zo geliefde boekhandel. Logeerpartijen van mijn zoon bleken al snel te vermoeiend. Veel vakanties en mooie plannen werden afgeblazen omdat het te zwaar was.

Maar mijn moeder was er nog en ze maakte volop mooie plannen, ook al zouden die misschien niet allemaal lukken. Ze krabbelde op en 2017 was zowaar een echt goed jaar. Daarna kreeg ze steeds meer vage klachten. Mijn moeder probeerde de ene therapie na de andere – want dit was volgens haar artsen vast iets psychisch. Ze kreeg ook steeds vaker rugpijn – maar dat was vast spanning.

Tijdens de intelligente lockdown dit voorjaar werd die rugpijn steeds erger. Ik zag hoe mijn moeder vocht tegen tranen van de pijn als ze via Skype haar kleinkinderen voorlas. Ze kreeg steeds meer pijnstillers en zonder dat ze een arts had gezien zat ze op een gegeven moment aan de morfine. Desondanks had ze nog steeds pijn. In juni kon er eindelijk een MRI-scan gemaakt worden. En toen zaten er overal in haar rug uitzaaiingen. De kanker was terug; en waarschijnlijk al een hele tijd. Genezen kon niet meer, hooguit een beetje tijd rekken en de pijn stillen. Inmiddels heeft mijn moeder gekozen voor een palliatief traject: geen behandelingen meer, maar zo goed mogelijk de laatste tijd beleven met degenen die haar lief zijn.

Ze werd deze augustus 64 en dat is het lievelingsgetal van mijn inmiddels 9-jarige zoon. Mijn moeder gaf hém bij haar verjaardag een schilderijtje dat ze had gemaakt van de steentjes die hij in 2012 in Zwolle verzamelde – al die jaren had zij die liefdevol bewaard. De steentjes vormen het getal 64 als een letterlijk tastbare herinnering aan zijn oma. Zijn lievelingsgetal en waarschijnlijk haar eindpunt. En nu denk ik bij elke 64 die ik zie aan mijn fantastische moeder, mijn zoon, die steentjes en hoe volkomen oneerlijk het leven kan zijn.

Deze column verscheen op 25 september 2020 in de Volkskrant.

Het omgekeerde van het onterechte verband tussen ijsverkoop en verdrinkingen

Een beruchte denkfout is het onterecht leggen van een verband tussen twee dingen die door hetzelfde veroorzaakt worden. Een klassiek voorbeeld is het verband tussen ijsverkoop en verdrinkingen. Hoe meer ijs er gekocht wordt, hoe meer mensen er verdrinken. Dat komt natuurlijk niet doordat ijs levensgevaarlijk is voor zwemmers. Warm weer veroorzaakt zowel meer behoefte aan ijs als meer zwempartijen en dus verdrinkingen.

Deze zomer leerde ik dat de omgekeerde denkfout ook bestaat: het onterecht leggen van een verband tussen twee dingen doordat die allebei hetzelfde veroorzaken. Dit klinkt tegen-intuïtief, maar een getallenvoorbeeld laat zien hoe dit kan.

Stel dat een op de tien mensen de longziekte Argh heeft en een op de vijf de ellendige buikgriep Barf. De twee ziekten zijn onafhankelijk van elkaar en daarmee heeft dus een op vijftig mensen zowel Argh als Barf. In de totale bevolking heb je dus 2 procent mensen met zowel Argh als Barf, 8 procent met alleen Argh, 18 procent met alleen Barf en 72 procent geluksvogels met geen van beide.

Zowel Argh als Barf veroorzaakt extra doktersbezoeken. Waar slechts 5 procent van de mensen zonder deze ziekten hun huisarts bezoekt, gaat 10 procent van de mensen met Argh en/of Barf naar hun dokter.

Vervolgens besluiten artsen om data over Argh en Barf te analyseren, waarbij ze kijken naar de gegevens van alle mensen die langskomen.
stethoscoop
In een groep van 100.000 mensen die zich keurig volgens de statistieken gedragen (en dat doen ze, want dit is een hypothetisch voorbeeld) zijn dat 200 mensen met zowel Argh als Barf, 800 met alleen Argh, 1.800 met alleen Barf en 3.600 mensen die geen Argh en ook geen Barf hebben.

Een nieuwsgierige arts onderzoekt of Barf beschermt tegen Argh. Van de in totaal 1.000 patiënten met Argh hebben er 200 ook Barf: dat zijn er (precies zoals in de hele bevolking) een op de vijf. Maar van de in totaal 5.400 patiënten zonder Argh die naar de dokter komen, hebben er 1.800 Barf: dat zijn er dus één op drie. Kortom: deze arts zou uit haar data kunnen concluderen dat mensen met Argh blijkbaar minder kans hebben om ook Barf te krijgen. Terwijl dat niet zo is, artsen zien mensen die Argh noch Barf hebben domweg minder vaak.

Deze vorm van selectiebias waarbij twee groepen allebei meer kans hebben om geselecteerd te worden en zo schijnverbanden opleveren, heet ook wel Berkson’s paradox, of collider bias.

Dit verschijnsel duikt in allerlei vormen op. Wiskundige Jordan Ellenberg beschreef ene Alex die alleen uitgaat met mannen waarvan de aardigheid plus de knapheid boven een zeker minimum ligt. Alex zou dan het gevoel kunnen krijgen dat knappe mannen minder aardig zijn, ook als er in het algemeen geen enkel verband is tussen aardigheid en knapheid. Iets soortgelijks kan gelden voor mooie of zeldzame voorwerpen die op een veiling komen of bij Amerikaanse universiteiten die studenten werven die goed zijn in sport of studeren. Veel voorbeelden van dit verschijnsel komen uit de medische hoek, waar gewerkt wordt met data van patiënten in plaats van de hele bevolking.

En socioloog Tim Morris waarschuwde onlangs dat deze fout een grote bananenschil is waarover veel coronastudies kunnen uitglijden. Argh.

Deze column verscheen op 21 augustus 2020 in de Volkskrant.

Vierentwintig dagen

Deze week een klassiek raadsel dat, zoals zo vaak bij wiskunde, van toepassing blijkt op de actualiteit.

In een vijver groeit een bijzondere waterlelie. Deze plant verdubbelt elke dag in grootte. Na vierentwintig dagen is de vijver helemaal bedekt met lelies. Op welke dag is de helft van de vijver bedekt?

Intuïtief denken veel mensen aan ‘twaalf dagen’ als antwoord. Het gaat over vierentwintig dagen, dus de helft zal dan wel twaalf zijn. Maar het woord verdubbelen geeft het eigenlijk al weg: als de plant zich elke dag verdubbelt, dan heb je met een halfvolle vijver op dag drieëntwintig een compleet bedekte vijver op dag vierentwintig. Dus juiste antwoord is: na drieëntwintig dagen.

waterlelie

Weer dezelfde vijver en diezelfde waterlelie die elke dag in grootte verdubbelt waarbij na vierentwintig dagen het complete vijveroppervlak vol zit met waterlelie. Hoeveel procent van de vijver is op dag twaalf bedekt met waterlelies?

Probeer hierbij eens snel een schatting te maken. Hoeveel procent denk je, zonder al te veel rekenen? Je weet uit de vorige vraag dat vijftig procent in elk geval niet het goede antwoord is.

Je kunt dit stap voor stap terugrekenen, op dag tweeëntwintig zat je op 25%, de dag daarvoor op 12,5%. Enzovoorts, tot je ziet dat na twaalf dagen slechts 0,024% van het oppervlak van de vijver was bedekt. Ik durf te wedden dat de meeste lezers een stuk hoger zaten met hun eerste gok : deze zogenaamde exponentiële groei is behoorlijk lastig in te schatten.

Stel je toch eens voor dat dit jouw vijver is. Je ziet op dag één een waterlelie, op dag twee zijn het er twee. Je maakt je geen zorgen. Dit gaat allemaal niet zo hard. Na twaalf dagen is nog 99,98% van je vijver keurig waterlelievrij. Je negeert de vijver ruim anderhalve week en als je weer eens gaat kijken, dan is alles overwoekerd.

Weer dezelfde vijver, maar nu een waterlelie die elke dag met een factor drie in plaats van een factor twee groeit. Hoe lang duurt het nu voor de vijver helemaal bedekt is?

Uit de vorige opgaven kun je te terugrekenen dat die eenzame eerste waterlelie 0,000012% van het wateroppervlak bedekt. Nu doe je dit per dag maal drie, dus op dag twee eindig je met 0,000036% bedekte vijver. Zo ga je door en op dag 15 is ruim 57% van de vijver bedekt en al op dag 16 raakt je vijver compleet vol.

En dan nu de beloofde verbinding met de actualiteit: de berekeningen waar Angela Merkel naar verwees toen zij vorige week uitlegde hoe lastig het is om een goede exit-strategie te bepalen gaan over exponentiële groei als in de vijver (maar dan een stuk ingewikkelder). Merkel legde uit dat Duitsland nu op een besmettingsgetal van één zit, wat betekent dat elke corona-patiënt gemiddeld één iemand besmet en dat de epidemie beheersbaar is. Maar als je maatregelen versoepelt, dan gaat het besmettingsgetal misschien naar 1,1 wat zou betekenen dat het Duitse zorgsysteem in oktober overbelast raakt. Maar stijgt het besmettingsgetal naar 1,2, wat nauwelijks hoger klinkt, dan is het systeem al overbelast in juli.

Dit soort berekeningen kun je ongetwijfeld ook maken voor Nederland. En de boodschap van Merkel is universeel: een goede exit-strategie luistert heel, heel nauw.

Deze column verscheen op 24 april 2020 in de Volkskrant.

510 staandehoudingen en de zelfversterkende feedback-loop

Toen ik las over de vraag of de belastingdienst gebruik heeft gemaakt van etnisch profileren en de discussie over hoe de overheid meer algoritmen kan gebruiken, dacht ik steeds aan zelfversterkende feedback-loops. En hoe daarmee kleine verschillen tussen groepen kunnen worden opgeblazen tot gapende kloven.

Een fictief voorbeeld. In een ver land bestaat de bevolking uit twee even grote bevolkingsgroepen: de huffelpuffers en de ravenklauwen. Uit de statistieken blijkt dat de huffelpuffers verantwoordelijk zijn voor 51 procent van de misdaden en de ravenklauwen voor 49 procent. Uit nader onderzoek blijkt dat precies 51 procent van de huffelpuffers betrokken is bij criminele activiteiten, ­tegenover 49 procent van de ravenklauwen.

De politie besluit een nieuw datagedreven beleid in te zetten om criminaliteit op te sporen. Ze gaan elke maand duizend mensen staande houden en controleren. Daarbij zullen ze steeds de criminaliteitscijfers van de vorige maand gebruiken om te bepalen wat de meest ­effectieve manier van controleren is. Zo profileren ze mooi de meest waarschijnlijke criminelen. In dit fictieve voorbeeld nemen we aan dat de criminaliteit onder de bevolkingsgroepen constant blijft en dat het herkennen van criminelen volkomen vlekkeloos verloopt.

De politie begint met het feit dat 51 procent van de misdrijven gepleegd is door huffelpuffers en 49 procent door ravenklauwen. Die eerste maand houdt de politie daarom 510 huffelpuffers staande – waarvan 51 procent crimineel is, dat levert afgerond 260 misdadigers. Er worden daarnaast 490 ravenklauwen gecontroleerd, daarvan is 49 procent crimineel, dat geeft afgerond 240 misdadigers.

‘Zie je wel’, concludeert de politie: ‘Onze methode werkt als een tierelier – we zien dat de afgelopen maand zelfs 52 procent van de 500 gevonden criminelen een huffelpuffer was.’ De volgende maand worden er daarom 520 huffelpuffers en 480 ravenklauwen gecontroleerd. Hoppa, die maand blijkt zelfs 53 procent van de gevonden misdadigers een huffelpuffer.

Als dit systeem gestaag zo door blijft werken, wordt na twee jaar 73 procent van de criminaliteit toegeschreven aan huffelpuffers. Binnen vijf jaar is dat 90 procent en na zeven jaar worden er per maand nog slechts een stuk of dertig ravenklauwen gecontroleerd tegen zo’n 970 huffelpuffers.

De groep die bij invoering van het nieuwe systeem ietsje crimineler is, heeft net ietsje meer kans om gecontroleerd te worden. Waardoor ze ietsje vaker in de statistieken opduiken, waardoor ze iets vaker worden staande gehouden. Enzovoort: dit is een zelfversterkende feedback-loop. Terwijl het werkelijke verschil in criminaliteit tussen de twee groepen al die tijd een schamele twee procentpunt blijft: 51 versus 49.

Nu is dit een fictief voorbeeld. Maar we kennen helaas tal van echte voorbeelden waarbij zelfversterkende feedback-loops verwoestende gevolgen hadden. Cathy O’ Neill geeft in Weapons of Math Destruction een deprimerend overzicht. En laatst zag ik een grafiek voorbijkomen met daarin welke voetgangers de politie in New York staande houdt op basis van ‘redelijke verdenking’. Van elke duizend zwarte jongens van 20 worden er jaarlijks ongeveer 950 staandegehouden. Bij witte jongens van dezelfde leeftijd waren dat er ongeveer 175 van elke duizend. Toen vroeg ik me af hoe fictief mijn voorbeeld precies was.

Deze column verscheen op 21 juni 2019 in de Volkskrant.

17.187 patiënten

Wat doe je als iemand je dwingt om iets te doen dat je een heel dom idee vindt? Deze week las ik de glorieuze oplossing van onderzoeker Richard Peto: doe het samen met iets dat je een nóg dommer idee vindt. Dan voldoe je keurig aan de gegeven opdracht, maar laat je tegelijk je protest zien aan de goede verstaander.

In 1988 leidde Peto een groot onderzoek naar het gebruik van medicijnen tijdens een hartaanval. Er werd gekeken of overlevingskansen toenamen na het toedienen van aspirine of streptokinase – twee middelen die het samenklonteren van bloedplaatjes tegengaan. Het vermoeden was dat het toedienen van deze medicijnen de kans op complicaties door bloedpropjes verkleint.

De studie omvatte een indrukwekkende 17.187 patiënten. Sommige patiënten kregen alleen aspirine, anderen alleen streptokinase, sommigen allebei en weer anderen kregen een placebo. En dat allemaal keurig willekeurig verdeeld over al die patiënten om te testen wat nu het beste werkte.

Ruim vierduizend patiënten kregen zowel aspirine als streptokinase. In deze groep stierven 343 mensen binnen iets meer dan een maand na hun hartaanval. In de even grote groep patiënten die voor allebei de medicijnen een placebo kreeg, overleden in dezelfde periode 568 mensen. De statistische analyse en de conclusies waren glashelder: de behandeling kon levens redden.

Peto en zijn collega’s schreven al hun resultaten op en dienden ze in als wetenschappelijk artikel bij het prestigieuze tijdschrift The Lancet. En toen kwam het moment dat Peto gedwongen werd om iets doms te doen. Om zijn artikel te publiceren, moest hij namelijk zijn resultaten verder uitsplitsen naar allerlei verschillende groepen patiënten. Hoe zat het met verschillen tussen mannen en vrouwen? Maakte het uit of een patiënt diabetes heeft? En wat als de patiënt de week voor de hartaanval al aspirine had ingenomen?

Dat uitsplitsen vond Peto dus een heel dom idee. Hij had dit experiment juist opgezet met een groot aantal patiënten omdat je dan goed ziet wat er gebeurt. Als je vervolgens in kleine groepen gaat zoeken naar verschillen, dan vind je allerlei resultaten die meer ruis dan waarheid zijn. Stel bijvoorbeeld dat de kans 5% is dat je per ongeluk een verschil vindt tussen twee groepen patiënten waar in werkelijkheid niets aan de hand is. Als je twintig losse vergelijkingen tussen twee van zulke groepen maakt, dan is de kans 64% dat je minstens één keer een resultaat vindt dat eigenlijk niets betekent.

Maar als Peto zijn studie wilden publiceren, kon hij zulke vergelijkingen niet weigeren. Daarop voegde hij iets toe dat hij nóg dommer vond: een analyse met sterrenbeelden van patiënten. Voor tweelingen en weegschalen bleek aspirine averechts te werken. Voor alle andere sterrenbeelden was het goed. Peto zette deze analyse pal bovenaan zijn tabel met de gevraagde analyses van losse groepen en liet daarmee zien hoe serieus je al die cijfers moet nemen. En de Lancet drukte het keurig af.

Deze column verscheen eerder in de Volkskrant