Clear Sky Science · fr

Manques FAIR et volonté de collaboration parmi les centres de recherche sur les hémoglobinopathies

· Retour à l’index

Pourquoi de meilleures données peuvent changer des vies

Des maladies sanguines graves comme la drépanocytose et la thalassémie affectent des millions de personnes dans le monde, souvent avec des complications à vie. Les médecins et les chercheurs recueillent déjà une grande quantité d’informations sur ces patients, allant de simples analyses sanguines à des séquençages génétiques complexes. Mais une grande partie de ces données reste enfermée dans des fichiers informatiques ou des systèmes hospitaliers isolés qui ne communiquent pas facilement entre eux. Cet article décrit un effort international visant à évaluer comment les centres de prise en charge des troubles de l’hémoglobine organisent aujourd’hui leurs données, où se situent les principales lacunes et dans quelle mesure ils sont prêts à collaborer pour que les informations des patients puissent mieux alimenter de nouvelles découvertes et une meilleure prise en charge.

Qui a participé à ce bilan des données

L’étude a interrogé 44 équipes dans 22 pays appartenant à HELIOS, un réseau européen axé sur les maladies sanguines héréditaires. Les participants comprenaient des médecins, des biologistes de laboratoire, des spécialistes des données et des représentants de patients, reflétant la diversité des acteurs impliqués dans la prise en charge de ces pathologies. Les centres allaient d’hôpitaux bien dotés en Europe de l’Ouest à des cliniques et laboratoires de pays disposant de moins de ressources pour la recherche, y compris dans certaines régions d’Europe de l’Est, d’Afrique et d’Asie. Ensemble, ils prennent en charge des patients atteints de drépanocytose et de thalassémie alpha et bêta, trois des troubles sanguins héréditaires les plus fréquents au monde.

Figure 1
Figure 1.

Quelles données ces centres possèdent réellement

Le sondage montre que la plupart des centres collectent déjà les éléments de base nécessaires pour comprendre ces maladies. Presque tous disposent d’informations sur l’âge et le sexe des patients, des mesures de laboratoire de routine et des principales mutations génétiques responsables de leurs troubles sanguins. En revanche, les informations plus détaillées sont plus difficiles à obtenir. Moins de centres consignent de manière structurée les symptômes, les actes hospitaliers ou les examens d’imagerie de façon exploitable par des ordinateurs. Les ressources les plus rares sont les types de données avancées, comme le séquençage du génome entier, d’autres données « omiques » ou des mesures issues de dispositifs, qui sont généralement disponibles uniquement dans des structures de recherche mieux financées. Les centres des pays moins bien dotés étaient particulièrement susceptibles de ne pas disposer de ces jeux de données riches, ce qui complique leur participation aux études de pointe.

Comment les données sont stockées et partagées

L’étude a également examiné la manière dont les centres stockent leurs informations et si elles sont prêtes à être combinées entre sites. Près de la moitié des répondants conservent les données de recherche dans des bases locales, souvent avec des outils familiers tels que des feuilles de calcul ou REDCap, une plateforme de recherche courante. Très peu utilisent des standards internationaux conçus pour rendre les données de santé interopérables entre institutions. Un seul centre sur cinq a déclaré utiliser des systèmes de codage médical largement acceptés pour les symptômes ou les diagnostics, et aucun n’a signalé l’utilisation des « modèles de données communs » populaires qui deviennent la norme dans les grandes études de santé. Des mesures pratiques telles que des règles formelles sur la durée de conservation des données ou des méthodes standardisées pour retirer les identifiants personnels étaient également peu répandues, et de nombreux membres du personnel ignoraient ce que faisaient précisément leurs propres institutions.

Figure 2
Figure 2.

Ouverture à la collaboration

Malgré ces lacunes techniques, l’aspect humain de la collaboration paraît beaucoup plus prometteur. La plupart des équipes avaient déjà utilisé leurs données pour des recherches publiées ou en cours, et un écrasant 95 % ont déclaré être intéressés à participer à des études multicentriques. Fait notable, 86 % se sont dits prêts à rejoindre des projets « fédérés », où les données restent sur des serveurs locaux et seuls des résultats synthétiques sont partagés — une approche qui peut aider à protéger la vie privée et à atténuer les contraintes juridiques. Même certains centres qui n’avaient encore jamais utilisé leurs données pour la recherche ont indiqué être prêts à participer, ce qui suggère l’existence d’un réservoir d’informations inexploitées pouvant être intégrées à de futurs projets avec le soutien approprié.

Ce qui doit changer ensuite

Lorsque les chercheurs ont comparé les pratiques actuelles à l’idéal des données « FAIR » — des informations Findable (trouvables), Accessible, Interoperable et Reusable (réutilisables) — ils ont constaté un tableau mitigé. Environ la moitié des centres disposaient d’au moins une documentation de base décrivant leurs jeux de données, et plus de la moitié ont indiqué que leurs données avaient déjà été utilisées dans des recherches avec les autorisations appropriées. Mais presque personne n’avait déposé de jeux de données dans des dépôts publics, et quasiment aucun n’utilisait de standards techniques partagés facilitant la combinaison des données provenant de lieux différents. Les auteurs soutiennent que des investissements ciblés dans l’infrastructure, la formation et des boîtes à outils de gouvernance simples pourraient aider les centres, en particulier dans les régions moins dotées, à adopter des formats communs et des pratiques de gestion des données plus sûres et plus cohérentes.

Pourquoi cela compte pour les patients

Pour les personnes vivant avec la drépanocytose ou la thalassémie, les détails sur les standards de données peuvent sembler abstraits, mais ils ont des conséquences très concrètes. Lorsque les informations de milliers de patients peuvent être agrégées et comparées, les chercheurs sont mieux à même d’identifier quels traitements fonctionnent le mieux, quelles complications surveiller et comment les nouvelles thérapies géniques se comportent à long terme. Cette enquête montre que, bien que de nombreux centres de prise en charge des troubles de l’hémoglobine dépendent encore de systèmes de données fragmentés et incohérents, il existe un fort appétit pour la collaboration — en particulier via des réseaux préservant la confidentialité qui permettent aux données de rester localisées. Transformer cette volonté en données bien organisées et connectées pourrait accélérer les découvertes et contribuer à ce que les patients, où qu’ils vivent, bénéficient des meilleures évidences disponibles.

Citation: Tamana, S., Yiangou, K., Orphanou, K. et al. FAIR data gaps and collaboration willingness among hemoglobinopathy research centers. Sci Data 13, 582 (2026). https://doi.org/10.1038/s41597-026-06950-9

Mots-clés: hémoglobinopathies, données sur les maladies rares, données FAIR, recherche fédérée, interopérabilité des données