Clear Sky Science · ru

Пробелы в данных FAIR и готовность к сотрудничеству среди центров исследования гемоглобинопатий

· Назад к списку

Почему лучшие данные могут изменить жизнь

Тяжёлые заболевания крови, такие как серповидноклеточная анемия и талассемия, затрагивают миллионы людей во всём мире и часто сопровождаются пожизненными осложнениями. Врачи и учёные уже собирают много информации о таких пациентах — от простых анализов крови до сложных генетических исследований. Но значительная часть этих данных остаётся в изолированных файлах или больничных системах, которые плохо взаимодействуют друг с другом. В этой статье описывается международная инициатива, цель которой — выяснить, насколько хорошо центры по лечению нарушений гемоглобина организуют свои данные сегодня, где находятся основные пробелы и насколько они готовы к совместной работе, чтобы информация о пациентах могла эффективнее способствовать новым открытиям и улучшению ухода.

Кто участвовал в проверке данных

Исследование охватило 44 команды в 22 странах, входящих в HELIOS — европейскую сеть, сосредоточенную на наследственных заболеваниях крови. В опросе участвовали врачи, лабораторные специалисты, специалисты по данным и представители пациентских организаций, что отражает многопрофильный характер управления этими состояниями. Центры варьировались от хорошо оснащённых госпиталей в Западной Европе до клиник и лабораторий в странах с ограниченными исследовательскими ресурсами, включая части Восточной Европы, Африки и Азии. В совокупности эти центры наблюдают пациентов с серповидноклеточной болезнью и альфа- и бета-талассемией — тремя из наиболее распространённых наследственных заболеваний крови в мире.

Figure 1
Figure 1.

Какие данные есть у этих центров на самом деле

Опрос показывает, что большинство центров уже собирают базовые данные, необходимые для понимания этих заболеваний. Почти у всех есть сведения о возрасте и поле пациентов, рутинных лабораторных показателях и ключевых генетических изменениях, вызывающих нарушения крови. Однако более подробная информация встречается реже. Меньше центров фиксируют структурированные записи о симптомах, процедурах в стационаре или результатах визуализаций в формате, удобном для автоматического поиска. Наиболее дефицитными оказались продвинутые типы данных — такие как полногеномное секвенирование, другие «омики» или измерения с помощью устройств — которые чаще доступны лишь в более обеспеченных исследовательских центрах. Центры в странах с меньшими ресурсами особенно часто лишены таких богатых наборов данных, что затрудняет их участие в передовых исследованиях.

Как данные хранятся и обмениваются

Исследование также изучало, как центры хранят свои данные и готовы ли они к объединению информации между сайтами. Почти половина респондентов хранит исследовательские данные в локальных базах данных, часто используя привычные инструменты, такие как электронные таблицы или REDCap — распространённую платформу для исследований. Очень немногие применяют международные стандарты, предназначенные для того, чтобы медицинские данные были «вилки и розетки» между институтами. Только одна из пяти организаций сообщила об использовании общепринятых медицинских систем кодирования для симптомов или диагнозов, и никто не заявил об использовании популярных «общих моделей данных», которые становятся нормой в крупных исследованиях здравоохранения. Практические меры защиты, такие как формальные правила хранения данных или стандартизованные методы удаления персональных идентификаторов, также были редкостью, и многие сотрудники не были уверены в том, какие процедуры используются в их учреждениях.

Figure 2
Figure 2.

Готовность к совместной работе

Несмотря на технические пробелы, человеческий фактор сотрудничества выглядит гораздо более обнадёживающим. Большинство команд уже использовали свои данные для опубликованных или текущих исследований, и подавляющие 95% заявили, что заинтересованы в участии в многоцентровых проектах. Поразительные 86% выразили готовность присоединиться к «федеративным» проектам, где данные остаются на локальных серверах, и обмениваются лишь агрегированными результатами — подход, который может помочь защитить приватность и упростить правовые вопросы. Даже некоторые центры, которые ещё не использовали свои данные в исследованиях, заявили о готовности участвовать, что указывает на наличие неиспользуемого массива информации, который при правильной поддержке можно вовлечь в будущие проекты.

Что нужно изменить в следующем шаге

Сопоставив текущие практики с идеалом «FAIR»-данных — данных, которые легко найдемы, доступны, интероперабельны и повторно используемы — исследователи получили смешанную картину. Примерно в половине центров имелась по крайней мере базовая документация, описывающая наборы данных, и более половины сообщили, что их данные уже использовались в исследованиях с надлежащими разрешениями. Но почти никто не размещал наборы данных в публичных репозиториях, и почти никто не использовал общие технические стандарты, которые упрощают объединение данных из разных мест. Авторы считают, что целенаправленные инвестиции в инфраструктуру, обучение и простые инструменты управления могут помочь центрам, особенно в регионах с ограниченными ресурсами, перейти к единым форматам и более безопасному, последовательному обращению с данными.

Почему это важно для пациентов

Для людей с серповидноклеточной болезнью или талассемией тонкости стандартов данных могут звучать абстрактно, но они имеют очень реальные последствия. Когда информацию о тысячах пациентов можно объединить и сопоставить, исследователям легче выявлять, какие методы лечения работают лучше, какие осложнения требуют внимания и как новые генноориентированные терапии ведут себя в долгосрочной перспективе. Опрос показывает, что хотя многие центры по лечению нарушений гемоглобина по-прежнему опираются на фрагментированные и непоследовательные системы данных, существует сильное стремление к совместной работе — особенно через сети, сохраняющие данные локально и защищающие конфиденциальность. Превращение этой готовности в хорошо организованные, взаимосвязанные данные может ускорить открытия и помочь обеспечить, чтобы пациенты, где бы они ни жили, получали пользу от лучших доступных доказательств.

Цитирование: Tamana, S., Yiangou, K., Orphanou, K. et al. FAIR data gaps and collaboration willingness among hemoglobinopathy research centers. Sci Data 13, 582 (2026). https://doi.org/10.1038/s41597-026-06950-9

Ключевые слова: гемоглобинопатии, данные редких заболеваний, FAIR-данные, федеративные исследования, интероперабельность данных