Tag: verband

Het omgekeerde van het onterechte verband tussen ijsverkoop en verdrinkingen

Een beruchte denkfout is het onterecht leggen van een verband tussen twee dingen die door hetzelfde veroorzaakt worden. Een klassiek voorbeeld is het verband tussen ijsverkoop en verdrinkingen. Hoe meer ijs er gekocht wordt, hoe meer mensen er verdrinken. Dat komt natuurlijk niet doordat ijs levensgevaarlijk is voor zwemmers. Warm weer veroorzaakt zowel meer behoefte aan ijs als meer zwempartijen en dus verdrinkingen.

Deze zomer leerde ik dat de omgekeerde denkfout ook bestaat: het onterecht leggen van een verband tussen twee dingen doordat die allebei hetzelfde veroorzaken. Dit klinkt tegen-intuïtief, maar een getallenvoorbeeld laat zien hoe dit kan.

Stel dat een op de tien mensen de longziekte Argh heeft en een op de vijf de ellendige buikgriep Barf. De twee ziekten zijn onafhankelijk van elkaar en daarmee heeft dus een op vijftig mensen zowel Argh als Barf. In de totale bevolking heb je dus 2 procent mensen met zowel Argh als Barf, 8 procent met alleen Argh, 18 procent met alleen Barf en 72 procent geluksvogels met geen van beide.

Zowel Argh als Barf veroorzaakt extra doktersbezoeken. Waar slechts 5 procent van de mensen zonder deze ziekten hun huisarts bezoekt, gaat 10 procent van de mensen met Argh en/of Barf naar hun dokter.

Vervolgens besluiten artsen om data over Argh en Barf te analyseren, waarbij ze kijken naar de gegevens van alle mensen die langskomen.
stethoscoop
In een groep van 100.000 mensen die zich keurig volgens de statistieken gedragen (en dat doen ze, want dit is een hypothetisch voorbeeld) zijn dat 200 mensen met zowel Argh als Barf, 800 met alleen Argh, 1.800 met alleen Barf en 3.600 mensen die geen Argh en ook geen Barf hebben.

Een nieuwsgierige arts onderzoekt of Barf beschermt tegen Argh. Van de in totaal 1.000 patiënten met Argh hebben er 200 ook Barf: dat zijn er (precies zoals in de hele bevolking) een op de vijf. Maar van de in totaal 5.400 patiënten zonder Argh die naar de dokter komen, hebben er 1.800 Barf: dat zijn er dus één op drie. Kortom: deze arts zou uit haar data kunnen concluderen dat mensen met Argh blijkbaar minder kans hebben om ook Barf te krijgen. Terwijl dat niet zo is, artsen zien mensen die Argh noch Barf hebben domweg minder vaak.

Deze vorm van selectiebias waarbij twee groepen allebei meer kans hebben om geselecteerd te worden en zo schijnverbanden opleveren, heet ook wel Berkson’s paradox, of collider bias.

Dit verschijnsel duikt in allerlei vormen op. Wiskundige Jordan Ellenberg beschreef ene Alex die alleen uitgaat met mannen waarvan de aardigheid plus de knapheid boven een zeker minimum ligt. Alex zou dan het gevoel kunnen krijgen dat knappe mannen minder aardig zijn, ook als er in het algemeen geen enkel verband is tussen aardigheid en knapheid. Iets soortgelijks kan gelden voor mooie of zeldzame voorwerpen die op een veiling komen of bij Amerikaanse universiteiten die studenten werven die goed zijn in sport of studeren. Veel voorbeelden van dit verschijnsel komen uit de medische hoek, waar gewerkt wordt met data van patiënten in plaats van de hele bevolking.

En socioloog Tim Morris waarschuwde onlangs dat deze fout een grote bananenschil is waarover veel coronastudies kunnen uitglijden. Argh.

Deze column verscheen op 21 augustus 2020 in de Volkskrant.