Clear Sky Science · nl

Ontwerpen van een verklaarbaar algoritme op basis van XGBoost en een genetisch algoritme voor het voorspellen van ziekenhuisopnamebehoeften bij COVID-19-patiënten

2026-02-23 · Terug naar het overzicht

Waarom dit belangrijk is voor de dagelijkse zorg

Tijdens de COVID-19-pandemie moesten artsen vaak zeer snel beslissen wie een ziekenhuisbed nodig had en wie veilig thuis kon herstellen. Dit artikel beschrijft een computerondersteund hulpmiddel dat bij die beslissing helpt. Het probeert twee belangrijke eigenschappen te combineren: sterke nauwkeurigheid in het signaleren van risicopatiënten en duidelijke, eenvoudige verklaringen waarop artsen daadwerkelijk kunnen vertrouwen en die zij kunnen gebruiken.

Van patiëntgegevens naar vroege waarschuwingen

De onderzoekers analyseerden medische dossiers van 1.278 volwassenen met COVID-19 die tussen april 2020 en maart 2021 in één ziekenhuis in Iran werden gezien. Van elke persoon verzamelden zij 27 gegevenspunten, waaronder leeftijd, zuurstofsaturatie, bloedtesten zoals C-reactief proteïne en D-dimeer, symptomen zoals koorts of ademnood, en bestaande aandoeningen zoals diabetes of hoge bloeddruk. Alleen dossiers met solide laboratorium- of scanbewijzen van COVID-19 en redelijk volledige gegevens werden behouden. Het team maakte de dataset zorgvuldig schoon, vulde enkele ontbrekende waarden met statistische methoden op, verwijderde duidelijke fouten en splitste de gegevens vervolgens in aparte groepen voor het bouwen en testen van hun modellen.

Het bouwen van een krachtig voorspellingsmechanisme

In de kern van het systeem staat een machine-learningmethode genaamd XGBoost, die zeer goed is in het vinden van patronen in complexe gegevens. Het hulpmiddel leert van eerdere patiënten welke combinaties van metingen doorgaans duiden op een behoefte aan ziekenhuiszorg. Bij tests, uitgevoerd 100 keer op nieuwe data, onderscheidde het succesvol hogere-risico van lagere-risicopatiënten met een area under the curve van 0,85, wat aangeeft dat het sterk was in het rangschikken wie meer kans had op opname. Het identificeerde grofweg drie van de vier patiënten die daadwerkelijk ziekenhuisopname nodig hadden en stelde correct gerust bij ongeveer negen van de tien mensen die dat niet deden. Vergeleken met meer traditionele benaderingen — zoals logistische regressie, random forests, een eenvoudig neuronaal netwerk en een andere boomgebaseerde methode genaamd LightGBM — leverde XGBoost de beste combinatie van nauwkeurigheid en betrouwbaarheid.

Van zwarte doos naar duidelijke regels voor artsen

Zuiver statistische modellen kunnen aanvoelen als een zwarte doos: ze geven een risicoscore maar geen mensvriendelijke reden. Om die doos te openen voegde het team een tweede laag toe die het gedrag van het model omzet in korte, gemakkelijk leesbare regels van de vorm “ALS deze voorwaarden aanwezig zijn, DAN is ziekenhuisopname waarschijnlijk.” Eerst trainden ze een reeks kleine beslisbomen die telkens maar enkele voorwaarden gebruiken, en behandelden vervolgens elk pad door deze bomen als een kandidaatregel. Een genetisch algoritme — een optimalisatiemethode geïnspireerd op evolutie — werd gebruikt om deze regels te trimmen en verfijnen, waarbij alleen die regels werden behouden die zowel nauwkeurig waren als op genoeg patiënten van toepassing waren om nuttig te zijn. Ten slotte beoordeelden tien artsen uit relevante specialismen de regels en behielden alleen die regels die medisch zinvol en duidelijk waren. Dit proces leverde 40 definitieve regels op, 20 die naar ziekenhuisopname wijzen en 20 die duiden op veilige poliklinische zorg.

Wat het model leerde over risico

Toen de onderzoekers onderzochten welke metingen het meest van belang waren, stak een kleine groep er bovenuit. Lage zuurstofsaturatie, hoge C-reactieve proteïne, hogere leeftijd, verhoogd D-dimeer, hoog ferritine en een laag percentage lymfocyten hadden de grootste impact op de voorspellingen — wat overeenkomt met de ervaring van de werkvloer dat zuurstofniveaus en tekenen van ontsteking of stolling cruciaal zijn. Aandoeningen zoals diabetes, aanzienlijke longbetrokkenheid op CT-scans en ademnood speelden ook een rol, maar waren iets minder centraal. Veelvoorkomende symptomen zoals hoesten of spierpijn droegen weinig bij aan de beslissing wie een ziekenhuisbed nodig had. Het team controleerde ook de prestaties bij mannen en vrouwen, jongere en oudere patiënten, en personen met of zonder grote chronische ziekten. De verschillen waren klein en niet statistisch significant, wat suggereert dat het hulpmiddel redelijk eerlijk presteerde over deze groepen, althans in deze dataset.

Hoe dit kan helpen bij toekomstige uitbraken

In de praktijk zou het systeem in twee fasen werken. Eerst berekent het XGBoost-model een risico op ziekenhuisopname op basis van iemands basisgegevens, vitale functies en routinematige bloedtesten. Ten tweede zoekt het hulpmiddel naar één van de door experts goedgekeurde regels die past bij deze patiënt — bijvoorbeeld een bepaalde combinatie van lage zuurstof, hoge ontstekingsmarkers en leeftijd. Als een bijpassende regel wordt gevonden die overeenkomt met de voorspelling van het model, presenteert het hulpmiddel die regel aan de behandelaar als de redenering achter de voorgestelde beslissing. De auteurs beargumenteren dat dit tweedelige ontwerp — nauwkeurige voorspelling plus eenvoudige, getoetste regels — kunstmatige intelligentie acceptabeler kan maken in echte klinieken. Omdat het regelgeneratieproces modulair is, kunnen vergelijkbare systemen snel worden hertraind voor nieuwe infectieziekten met lokaal verzamelde gegevens, waardoor ziekenhuizen patiënten kunnen triëren en schaarse middelen kunnen beheren tijdens toekomstige gezondheidscrises.

Bronvermelding: Abkar, A., Mehrabi, M., Golabpour, A. et al. Designing an explainable algorithm based on XGBoost and genetic algorithm for predicting hospitalization needs of COVID-19 patients. Sci Rep 16, 10210 (2026). https://doi.org/10.1038/s41598-026-40120-6

Trefwoorden: COVID-19 triage, voorspelling ziekenhuisopname, verklaarbare AI, klinische besluitondersteuning, machine learning in de gezondheidszorg