Clear Sky Science · nl

Processen voor het harmoniseren van kankerdata naar het Observational Medical Outcomes Partnership Common Data Model

2026-05-22 · Terug naar het overzicht

Waarom het samenbrengen van kankerdata ertoe doet

Kankerzorg genereert enorme hoeveelheden informatie uit ziekenhuizen, registraties, laboratoria en zelfs patiëntvragenlijsten, maar deze gegevens worden vaak in verschillende formaten opgeslagen die niet gemakkelijk "met elkaar kunnen praten". Dit artikel legt uit hoe onderzoekers een helder, stapsgewijs proces hebben ontworpen om deze verspreide kankerinformatie om te zetten naar één goed georganiseerd formaat zodat het betrouwbaarder kan worden gebruikt voor studies naar behandelpatronen, overleving en volksgezondheid.

Veel data-eilanden in plaats van één gedeeld beeld

Kankerdata zijn uitzonderlijk gedetailleerd. Ze beschrijven tumortype, stadium, genetische markers, behandelingen in de tijd, bijwerkingen en uitkomsten, en ze komen uit veel bronnen zoals elektronische patiëntendossiers, kankerregistries, verzekeringsclaims, biobanken en vragenlijsten. Omdat elke bron zijn eigen structuur en naamgevingsregels hanteert, is het samenvoegen ervan moeilijk en leidt het vaak tot hiaten of verlies van betekenis. Het Observational Medical Outcomes Partnership Common Data Model, of OMOP CDM, biedt een gedeelde structuur voor gezondheidsdata en wordt wereldwijd steeds vaker gebruikt. Bestaande richtlijnen voor het overbrengen van kankerdata naar dit model waren echter vaak algemeen, waardoor teams hun eigen lokale oplossingen moesten uitvinden.

Figure 1. Verspreide kankerregistraties uit meerdere bronnen samenbrengen in één gedeelde, goed georganiseerde onderzoeksdataset.

Wat eerdere projecten laten zien

De auteurs onderzochten 20 projecten, afkomstig uit wetenschappelijke tijdschriften en presentaties van een internationale datawetenschapsgemeenschap, die al hadden geprobeerd kankerdata naar het OMOP-formaat te converteren. De meeste richtten zich op ofwel patiëntniveau-onderzoek, zoals het bestuderen van uitkomsten van specifieke behandelingen, of op populatieniveau-vragen zoals overlevingstrends en ziektebewaking. Kankerregistries en ziekenhuisdossiers waren de meest voorkomende gegevensbronnen, meestal uit Europese centra, met minder voorbeelden uit Amerika en Azië. Veel teams gebruikten gespecialiseerde softwaretools uit de OMOP-gemeenschap om brondata te verkennen, mappings te ontwerpen, kwaliteit te controleren en behandelregimes af te leiden, maar de manieren waarop ze hun werk organiseerden verschilden sterk.

Belangrijke obstakels die steeds terugkomen

In deze projecten deden zich drie soorten problemen herhaaldelijk voor. Ten eerste waren de beginggevens rommelig of onvolledig: belangrijke details ontbraken, stonden in vrije tekst of waren verspreid over meerdere systemen, en het combineren van meerdere bronnen vereiste intensieve opschoning en curatie. Ten tweede was het mappen van lokale codes en beschrijvingen naar standaard OMOP-termen lastig, vooral voor rijke kankerdetails zoals stadiumaanduiding, biomarker-resultaten en complexe medicijncombinaties; de standaardvocabularia waren soms niet fijnmazig genoeg en vrije tekst of genomische data vroegen om extra tools en deskundige invoer. Ten derde, zodra een mapping was opgebouwd, bleef deze niet stabiel; het common data model, de vocabularia en de tools evolueren snel, dus teams moesten plannen hebben om hun systemen in de loop van de tijd bij te werken.

Een vijfstappenroutekaart voor teams

Op basis van patronen uit de review en feedback van kankerdata-experts destilleerden de auteurs een generiek vijfstappenharmonisatieproces toegespitst op oncologie. De eerste stap, Initiatie, omvat het vormen van een interdisciplinair team, overeenstemming over het onderzoeksdoel, inzicht in lokale regels en vertrouwd raken met het OMOP-ecosysteem. Requirement Analysis gaat vervolgens dieper in op de brondata: welke typen gegevens bestaan, hoe zijn ze gestructureerd, hoe compleet en betrouwbaar zijn ze en waar de grootste risico’s liggen. Design Planning vertaalt dit begrip naar een gedetailleerd plan voor hoe de data te transformeren en te mappen, welke tools te gebruiken, hoe zorgepisodes zoals behandeltrajecten af te handelen en hoe succes te beoordelen.

Figure 2. Gestructureerde schoonmaak en afstemming van ruwe kankerregistraties in verbonden episodes die de zorg van elke patiënt in de tijd volgen.

Van ruwe dossiers naar bruikbare onderzoeksdata

De vierde stap, Technische Implementatie, voert het plan uit. Hier maken teams de data schoon en cureren ze deze, extraheren relevante onderdelen, transformeren ze naar de OMOP-tabellen en controleren systematisch de kwaliteit. Speciale aandacht gaat uit naar het opbouwen van tijdlijnen van ieders kankertraject met OMOP-tabellen die episodes en hun gekoppelde gebeurtenissen vertegenwoordigen, zoals diagnoses, procedures en blootstelling aan geneesmiddelen. De vijfde stap, Onderhoud, erkent dat het werk nooit af is: vocabularia, softwaretools en oncologische kennis veranderen, dus teams moeten updates plannen, monitoren op nieuwe problemen en hun mappings en conventies verfijnen. Twee dwarsdoorsnijdende principes ondersteunen alle stappen: cycli van testen en verbeteren herhalen, en zorgvuldige documentatie van beslissingen zodat het werk transparant en herbruikbaar is.

Wat dit betekent voor patiënten en onderzoekers

Voor niet‑specialisten is de belangrijkste boodschap dat beter gebruik van bestaande kankerdata minder afhangt van nieuwe gadgets en meer van zorgvuldige, gedeelde methoden om informatie te organiseren. Dit artikel biedt een praktische routekaart die elk ziekenhuis of onderzoeksgroep kan aanpassen om verspreide kankerregistraties naar een gemeenschappelijk formaat te brengen, met respect voor lokale regels en technologie. Door het eenvoudiger te maken data te bundelen over centra en landen heen, beoogt het voorgestelde proces betrouwbaardere studies te ondersteunen over hoe kankers behandeld worden en hoe patiënten het er in de dagelijkse praktijk van afbrengen, zodat clinici en beleidsmakers beslissingen kunnen baseren op een helderder en vollediger beeld.

Bronvermelding: Nada, I.P., Bonacina, S. Data harmonization processes of cancer data into the observational medical outcomes partnership common data model. Sci Rep 16, 15993 (2026). https://doi.org/10.1038/s41598-026-53570-9

Trefwoorden: kankerdata, OMOP common data model, dataharmonisatie, real world evidence, gezondheidsinformatica