Clear Sky Science · nl

Van een “negatieve” proef naar positieve klinische impact: het beperken van temporele selectiebias door toelatingscriteria in nagebootste klinische onderzoeken

2026-05-27 · Terug naar het overzicht

Waarom het uitmaakt wie in een onderzoek komt

Als we horen dat een klinische proef geen verschil vond tussen twee behandelingen, is het verleidelijk te denken dat het verhaal daarmee afgelopen is. Maar wat gebeurt er als artsen later proberen die proef opnieuw af te spelen met echte patiëntgegevens uit de dagelijkse zorg? Deze studie toont aan dat de regels over wie in een “kopie”-onderzoek mag komen de resultaten stilletjes kunnen buigen, soms meer dan de tijdsverloop of veranderingen in medische praktijk.

Figure 1. Hoe grootschalige studies op basis van medische dossiers een hartmedicijnproef naspelen en hoe patiëntselectie het algemene resultaat verandert.

Van gecontroleerde proef naar de echte wereld

De oorspronkelijke WARCEF-proef vergeleek twee bloedverdunnende middelen, warfarine en aspirine, bij mensen met hartfalen en een verzwakte hartpomp maar zonder een veelvoorkomend hartritmestoornis genaamd atriumfibrilleren. In dit zorgvuldig uitgevoerde experiment werden meer dan 2.300 vrijwilligers willekeurig toegewezen aan het ene of het andere middel, en de proef vond geen duidelijke winnaar voor het voorkomen van overlijden. Later bleken richtlijnen te adviseren om vergelijkbare hartfalenpatiënten niet routinematig langdurig op warfarine te zetten tenzij daar een sterke reden voor was, deels omdat het lagere beroerisko werd opgeheven door meer ernstige bloedingen.

WARCEF naspelen met medische dossiers

De nieuwe studie onderzocht wat er gebeurt als onderzoekers proberen WARCEF te “emuleren” met elektronische medische dossiers van de Mayo Clinic. In plaats van medicijnen willekeurig toe te wijzen, keken ze naar duizenden patiënten die toevallig in de routinezorg aspirine of warfarine kregen voorgeschreven, zowel vóór als na het afronden van de WARCEF-proef in 2014. Ze gebruikten statistische methoden om duidelijke verschillen tussen de groepen in balans te brengen en volgden een intention-to-treat-benadering, waarbij mensen werden geteld met het middel waarmee ze begonnen, zelfs als later wijzigingen optraden, om de logica van de originele proef na te bootsen.

Een verrassende verschuiving na 2014

Op het eerste gezicht suggereerden de resultaten een belangrijke verandering in de loop van de tijd. Onder patiënten die vóór 2014 werden behandeld, zag de studie geen betekenisvol verschil in sterfte tussen de twee middelen, wat de oorspronkelijke proef weerspiegelde. Maar bij patiënten die na 2014 werden behandeld, hing warfarine samen met een veel hoger sterfterisico dan aspirine. Toen de onderzoekers alle jaren samenvoegden, werd het algehele beeld gedomineerd door deze latere patiënten, waardoor aspirine er duidelijk veiliger uitzag. Dit patroon zou kunnen suggereren dat, nadat artsen de proefresultaten en nieuwe richtlijnen zagen, het gebruik van warfarine in de praktijk veranderde en de schijnbare werking verslechterde.

Hoe één toelatingsregel het beeld vertekende

Nader onderzoek bracht een ander verhaal aan het licht. Om trouw te blijven aan de proef probeerde het team veel van dezelfde insluitingsregels toe te passen, waaronder een score genaamd de Modified Rankin Score, die beschrijft hoe gehandicapt iemand is na een beroerte. In de echte wereld wordt die score vaak laat, of helemaal niet, vastgelegd. Vereisen dat die score bestond voordat iemand als “in” de studie telde, betekende dat veel vroege sterfgevallen nooit werden gezien, waardoor de overlevingscurven kunstmatig vlak werden voor jaren. Toen de onderzoekers deze ene regel verwijderden, verdween het vreemde plateau en zag 2014 er niet langer bijzonder uit. Over veel verschillende afkapjaren verscheen hetzelfde patroon: de keuze van toelatingsregels, niet de kalenderdatum, dreef het merendeel van de verschillen in geneesmiddeleneffecten.

Figure 2. Hoe strakke instapfilters voor patiënten vroegtijdige sterfgevallen stilletjes uitstellen of uitsluiten, waardoor de schijnbare veiligheid van twee hartmedicijnen verandert.

Leerpunten voor het gebruik van grote gezondheidsgegevens

De studie benadrukt dat het opbouwen van proefachtige studies uit medische dossiers meer is dan alleen data en medicijnnamen kopiëren. Elke in- en uitsluitingsregel moet worden omgezet naar gegevens die mogelijk incompleet, vertraagd of alleen voor bepaalde patiënten vastgelegd zijn. Een regel die op papier onschuldig lijkt, kan in de praktijk precies de mensen filteren die vroeg slechte uitkomsten hebben, waardoor de vergelijking tussen behandelingen scheef trekt. De auteurs betogen dat zorgvuldige tests van hoe elk criterium verandert wie in de studie komt en wanneer gebeurtenissen plaatsvinden essentieel zijn om verborgen selectiebias te vermijden.

Wat dit betekent voor patiënten en artsen

Voor mensen met hartfalen en hun behandelaars draait dit werk het resultaat van de oorspronkelijke WARCEF-proef of de huidige richtlijnen niet om. Het biedt eerder een waarschuwing over hoe we “real world”-studies die proeven proberen te imiteren moeten interpreteren. Verschillen in resultaten in de loop van de tijd kunnen weerspiegelen hoe we patiënten kiezen en volgen, en niet plotselinge veranderingen in hoe een geneesmiddel werkt. Doordachte opzet en transparante rapportage van toelatingskeuzes zijn cruciaal als we willen dat grootschalige medische dossierstudies werkelijk de dagelijkse zorg informeren.

Bronvermelding: Li, X., Rajaganapathy, S., Hu, X. et al. From “negative” trial to positive clinical impact: mitigating eligibility criteria–induced temporal selection bias in emulated clinical trials. npj Health Syst. 3, 36 (2026). https://doi.org/10.1038/s44401-026-00082-3

Trefwoorden: trial emulation, eligibility criteria, hartfalen, warfarine versus aspirine, elektronische medische dossiers