Clear Sky Science · it

Dati FAIR mancanti e disponibilità alla collaborazione tra centri di ricerca sulle emoglobinopatie

· Torna all'indice

Perché dati migliori possono cambiare vite

Disturbi ematici gravi come la drepanocitosi e le talassemie colpiscono milioni di persone nel mondo, spesso con conseguenze croniche. Medici e ricercatori raccolgono già molte informazioni su questi pazienti, da semplici esami del sangue a indagini genetiche complesse. Tuttavia, gran parte di queste informazioni rimane in file isolati o in sistemi ospedalieri che non comunicano facilmente tra loro. Questo articolo descrive un impegno internazionale volto a capire come i centri per i disordini dell’emoglobina organizzino oggi i propri dati, dove sono i maggiori vuoti e quanto siano pronti a collaborare affinché le informazioni dei pazienti possano guidare in modo più efficace nuove scoperte e cure migliori.

Chi ha partecipato a questo controllo dello stato dei dati

Lo studio ha sondato 44 team in 22 Paesi appartenenti a HELIOS, una rete guidata dall’Europa focalizzata sulle malattie ematiche ereditarie. I partecipanti includevano medici, biologi di laboratorio, specialisti dei dati e rappresentanti dei pazienti, riflettendo le molte figure coinvolte nella gestione di queste condizioni. I centri andavano da ospedali ben forniti dell’Europa occidentale a cliniche e laboratori in Paesi con risorse di ricerca più limitate, comprese aree dell’Europa orientale, dell’Africa e dell’Asia. Insieme curano pazienti con drepanocitosi e talassemie alfa e beta, tre dei disturbi ematici ereditari più comuni al mondo.

Figure 1
Figure 1.

I dati effettivamente disponibili in questi centri

Il sondaggio mostra che la maggior parte dei centri raccoglie già le informazioni di base necessarie per comprendere queste malattie. Quasi tutti dispongono dei dati sull’età e il sesso dei pazienti, delle misurazioni di laboratorio di routine e dei principali cambiamenti genetici che causano i loro problemi ematici. Tuttavia, informazioni più dettagliate sono più difficili da reperire. Meno centri registrano in modo strutturato sintomi, interventi ospedalieri o indagini di imaging in formati facilmente interrogabili dai computer. Le risorse più scarse sono i tipi di dati avanzati come il sequenziamento dell’intero genoma, altri dati “omiici” o misurazioni da dispositivi, che tendono a essere disponibili solo in contesti di ricerca meglio finanziati. I centri nei Paesi con meno risorse erano particolarmente propensi a non avere questi dati ricchi, rendendo più difficile per loro partecipare a studi all’avanguardia.

Come i dati sono archiviati e condivisi

Lo studio ha esaminato anche come i centri archiviano le informazioni e se sono pronte a essere combinate tra siti. Quasi la metà dei rispondenti conserva i dati di ricerca in banche dati locali, spesso usando strumenti familiari come fogli di calcolo o REDCap, una piattaforma comune per la ricerca. Pochissimi usano standard internazionali pensati per rendere i dati sanitari interoperabili tra istituzioni. Solo un centro su cinque ha riportato di usare sistemi di codifica medica ampiamente accettati per sintomi o diagnosi, e nessuno ha dichiarato di impiegare i popolari “common data model” che stanno diventando la norma negli studi di grandi dimensioni. Accorgimenti pratici come regole formali sulla durata della conservazione dei dati o metodi standardizzati per rimuovere identificatori personali erano anche rari, e molti addetti non sapevano cosa stesse facendo la propria istituzione.

Figure 2
Figure 2.

Disponibilità a collaborare

Nonostante questi gap tecnici, l’aspetto umano della collaborazione appare molto più promettente. La maggior parte dei team aveva già utilizzato i propri dati per ricerche pubblicate o in corso, e un travolgente 95% ha dichiarato di essere interessato a partecipare a studi multicentrici. Un significativo 86% era disposto a unirsi a progetti “federati”, dove i dati restano su server locali e vengono condivisi solo risultati aggregati, un approccio che può aiutare a proteggere la privacy e semplificare gli aspetti legali. Anche alcuni centri che non avevano ancora usato i propri dati per la ricerca hanno detto di essere pronti a partecipare, suggerendo l’esistenza di un bacino di informazioni inutilizzato che potrebbe essere incluso in progetti futuri con il giusto supporto.

Cosa deve cambiare adesso

Quando i ricercatori hanno confrontato le pratiche attuali con l’ideale dei dati “FAIR” — informazione che sia Findable, Accessible, Interoperable e Reusable — hanno trovato un quadro misto. Circa la metà dei centri aveva almeno una documentazione di base che descriveva i propri dataset, e più della metà ha riferito che i propri dati erano già stati usati in ricerche con le necessarie autorizzazioni. Ma quasi nessuno aveva collocato i dataset in repository pubblici, e quasi nessuno usava standard tecnici condivisi che rendono semplice combinare dati provenienti da luoghi diversi. Gli autori sostengono che investimenti mirati in infrastrutture, formazione e kit di strumenti per la governance potrebbero aiutare i centri, in particolare nelle regioni meno attrezzate, a tendere verso formati comuni e a una gestione dei dati più sicura e coerente.

Perché questo è importante per i pazienti

Per le persone che vivono con drepanocitosi o talassemia, i dettagli sugli standard dei dati possono sembrare astratti, ma hanno conseguenze molto concrete. Quando le informazioni su migliaia di pazienti possono essere combinate e confrontate, i ricercatori riescono a individuare quali trattamenti funzionano meglio, quali complicanze vanno sorvegliate e come si comportano nel tempo nuove terapie geniche. Questo sondaggio mostra che, pur essendo ancora diffusi sistemi di dati frammentati e incoerenti, nei centri per i disordini dell’emoglobina esiste una forte volontà di collaborare — specialmente attraverso reti che preservano la privacy e mantengono i dati vicino al luogo d’origine. Trasformare questa disponibilità in dati ben organizzati e connessi potrebbe accelerare le scoperte e contribuire a garantire che i pazienti, ovunque vivano, traggano vantaggio dalle migliori evidenze disponibili.

Citazione: Tamana, S., Yiangou, K., Orphanou, K. et al. FAIR data gaps and collaboration willingness among hemoglobinopathy research centers. Sci Data 13, 582 (2026). https://doi.org/10.1038/s41597-026-06950-9

Parole chiave: emoglobinopatie, dati sulle malattie rare, dati FAIR, ricerca federata, interoperabilità dei dati