Clear Sky Science · pl
Luki w danych FAIR i gotowość do współpracy wśród ośrodków badających hemoglobinopatie
Dlaczego lepsze dane mogą zmieniać życie
Poważne choroby krwi, takie jak anemia sierpowata i talasemia, dotykają miliony ludzi na całym świecie, często powodując dolegliwości utrzymujące się przez całe życie. Lekarze i naukowcy gromadzą już dużo informacji o tych pacjentach — od podstawowych badań krwi po złożone badania genetyczne. Jednak wiele z tych danych znajduje się w odizolowanych plikach lub systemach szpitalnych, które trudno ze sobą połączyć. Ten artykuł opisuje międzynarodową inicjatywę, której celem było ustalenie, jak ośrodki zajmujące się zaburzeniami hemoglobiny organizują dziś swoje dane, gdzie występują największe luki i jak chętne są do współpracy, aby informacje o pacjentach mogły skuteczniej napędzać nowe odkrycia i lepszą opiekę.
Kto wziął udział w tej ocenie stanu danych
Badanie objęło 44 zespoły z 22 krajów należących do HELIOS, europejskiej sieci skupionej na dziedzicznych chorobach krwi. Wśród uczestników byli lekarze, naukowcy laboratoryjni, specjaliści od danych i rzecznicy pacjentów, co odzwierciedla różnorodność osób zaangażowanych w opiekę nad tymi schorzeniami. Ośrodki obejmowały wysoko wyposażone szpitale w Europie Zachodniej oraz kliniki i laboratoria w krajach o mniejszych zasobach badawczych, także w części Europy Wschodniej, Afryki i Azji. Razem opiekują się pacjentami z anemią sierpowatą oraz alfa- i beta-talasemią — trzema najczęstszymi dziedzicznymi chorobami krwi na świecie.

Jakie dane te ośrodki rzeczywiście posiadają
Badanie pokazuje, że większość ośrodków już zbiera podstawowe informacje potrzebne do zrozumienia tych chorób. Prawie wszystkie mają dane o wieku i płci pacjentów, rutynowe pomiary laboratoryjne oraz kluczowe zmiany genetyczne odpowiadające za zaburzenia krwi. Jednak bardziej szczegółowe informacje są rzadziej dostępne. Mniej ośrodków prowadzi ustrukturyzowane zapisy objawów, procedur szpitalnych czy badań obrazowych w formie łatwej do przeszukiwania przez komputery. Najrzadsze są zaawansowane typy danych, takie jak sekwencjonowanie całego genomu, inne dane „omics” czy pomiary z urządzeń — zwykle dostępne tylko w lepiej finansowanych placówkach badawczych. Ośrodki w krajach o mniejszych zasobach szczególnie często nie dysponowały tymi bogatymi typami danych, co utrudnia im udział w nowoczesnych badaniach.
Jak dane są przechowywane i udostępniane
Badanie analizowało także, jak ośrodki przechowują swoje informacje i czy nadają się one do łączenia między placówkami. Niemal połowa respondentów trzyma dane badawcze w lokalnych bazach danych, często używając znanych narzędzi, takich jak arkusze kalkulacyjne czy REDCap — popularna platforma badawcza. Bardzo niewiele ośrodków stosuje międzynarodowe standardy zaprojektowane tak, aby dane zdrowotne były plug-and-play między instytucjami. Jedynie jedna piąta ośrodków zgłosiła użycie powszechnie akceptowanych systemów kodowania medycznego dla objawów czy diagnoz, a nikt nie deklarował stosowania popularnych „wspólnych modeli danych”, które stają się normą w dużych badaniach zdrowotnych. Praktyczne zabezpieczenia, takie jak formalne zasady przechowywania danych czy ustandaryzowane metody usuwania identyfikatorów osobowych, także były rzadkie, a wielu pracowników nie było pewnych, co robi ich instytucja.

Otwartość na współpracę
Mimo tych technicznych luk, ludzki aspekt współpracy wygląda znacznie lepiej. Większość zespołów już wykorzystała swoje dane do publikowanych lub trwających badań, a przytłaczające 95% zadeklarowało zainteresowanie udziałem w badaniach wieloośrodkowych. Uderzające 86% było chętnych do przystąpienia do projektów „federowanych”, w których dane pozostają na lokalnych serwerach, a jedynie udostępniane są wyniki zbiorcze — podejście to może chronić prywatność i ułatwiać kwestie prawne. Nawet niektóre ośrodki, które nigdy jeszcze nie wykorzystywały swoich danych w badaniach, deklarowały gotowość do udziału, co sugeruje istnienie niewykorzystanego zasobu informacji, który przy odpowiednim wsparciu można włączyć do przyszłych projektów.
Co trzeba zmienić dalej
Porównując obecne praktyki z ideałem danych „FAIR” — czyli znajdywalnych, dostępnych, interoperacyjnych i nadających się do ponownego użycia — badacze zobaczyli mieszany obraz. Około połowa ośrodków miała przynajmniej podstawową dokumentację opisującą ich zbiory danych, a ponad połowa zgłosiła, że ich dane były już wykorzystywane w badaniach za stosownymi zgodami. Jednak niemal nikt nie umieścił zestawów danych w publicznych repozytoriach i prawie nikt nie stosował wspólnych standardów technicznych, które ułatwiają łączenie danych z różnych miejsc. Autorzy argumentują, że ukierunkowane inwestycje w infrastrukturę, szkolenia i proste zestawy narzędzi zarządzania mogłyby pomóc ośrodkom, szczególnie w regionach o mniejszych zasobach, przejść w stronę wspólnych formatów oraz bezpieczniejszego i bardziej spójnego przetwarzania danych.
Dlaczego to ma znaczenie dla pacjentów
Dla osób żyjących z anemią sierpowatą lub talasemią szczegóły standardów danych mogą brzmieć abstrakcyjnie, ale mają bardzo realne konsekwencje. Gdy informacje o tysiącach pacjentów można połączyć i porównać, naukowcy łatwiej zauważają, które terapie działają najlepiej, na jakie powikłania warto zwracać uwagę i jak nowe terapie genowe sprawdzają się w dłuższej perspektywie. To badanie pokazuje, że choć wiele ośrodków zajmujących się zaburzeniami hemoglobiny wciąż polega na fragmentarycznych i niespójnych systemach danych, istnieje silna chęć współpracy — zwłaszcza w ramach sieci chroniących prywatność, które pozwalają danym pozostać blisko miejsca ich pochodzenia. Przekształcenie tej gotowości w dobrze zorganizowane, powiązane zbiory danych mogłoby przyspieszyć odkrycia i pomóc zapewnić, że pacjenci, niezależnie od miejsca zamieszkania, korzystają z najlepszych dostępnych dowodów.
Cytowanie: Tamana, S., Yiangou, K., Orphanou, K. et al. FAIR data gaps and collaboration willingness among hemoglobinopathy research centers. Sci Data 13, 582 (2026). https://doi.org/10.1038/s41597-026-06950-9
Słowa kluczowe: hemoglobinopatie, dane w chorobach rzadkich, dane FAIR, badania federowane, interoperacyjność danych