Clear Sky Science · zh

血红蛋白病研究中心的FAIR数据缺口与合作意愿

· 返回目录

更好的数据为何能改变生命

像镰状细胞病和地中海贫血这样的严重血液疾病影响着全球数百万人的生命,通常伴随终身并发症。医生和科学家已经收集了大量关于这些患者的信息,从简单的血液化验到复杂的基因检测。但其中许多信息散落在孤立的电子文件或医院系统中,难以互通。本文描述了一项国际性工作,旨在了解血红蛋白疾病中心目前如何组织其数据、主要缺口在哪里,以及它们在多大程度上准备好协作,使患者信息更有效地推动新发现和更好的护理。

谁参与了这次数据健康检查

该研究对属于HELIOS的22个国家的44个团队进行了调查,HELIOS是一个以欧洲为主导、关注遗传性血液疾病的网络。参与者包括医生、实验室科学家、数据专家和患者倡导者,体现了管理这些疾病所需的多方角色。受访中心覆盖从西欧资源充足的医院到研究资源较少国家的诊所与实验室,包括东欧、非洲和亚洲的部分地区。它们共同为患有镰状细胞病以及α和β地中海贫血的患者提供护理,这三者是全球最常见的遗传性血液疾病之一。

Figure 1
Figure 1.

这些中心实际上拥有什么数据

调查显示,大多数中心已经收集了理解这些疾病所需的基本信息。几乎所有中心都有患者年龄和性别、常规实验室测量结果以及导致血液问题的关键基因变异信息。然而,更详细的信息较难获得。较少的中心以结构化、便于计算机检索的形式记录症状、住院手术或影像检查。最稀缺的是高级数据类型,如全基因组测序、其他“组学”数据或基于设备的测量,这些通常仅在资金较充足的研究环境中可用。资源较少国家的中心尤其可能缺乏这些丰富的数据类型,这使它们更难参与前沿研究。

数据如何存储与共享

研究还考察了中心如何存储信息及其是否准备好跨站点合并数据。近一半受访者将研究数据保存在本地数据库中,常用工具包括电子表格或常见研究平台REDCap。很少有中心使用旨在使健康数据在机构之间即插即用的国际标准。只有五分之一的中心报告使用了广泛接受的症状或诊断编码系统,且没有中心报告使用正成为大型健康研究常态的常用“共同数据模型”。诸如正式的数据保存期限规则或标准化的去标识方法等实际保障措施也并不常见,许多工作人员甚至不清楚其所在机构采用了何种做法。

Figure 2
Figure 2.

合作意愿

尽管存在这些技术差距,人际层面的合作前景却更为乐观。大多数团队已经将其数据用于已发表或正在进行的研究,压倒性的95%表示有兴趣参与多中心研究。令人注目的是,86%愿意加入“联合”项目——在该模式下数据保留在本地服务器,仅共享汇总结果,这种方法有助于保护隐私并缓解法律顾虑。即使是那些尚未将数据用于研究的中心,也有一些表示愿意参与,表明存在一批尚未开发的信息资源,如果给予适当支持,可以纳入未来项目。

接下来需要改变的地方

研究者将当前做法与“FAIR”数据理想(即可查找、可访问、可互操作、可重用)进行比较后,得出的是一幅参差不齐的图景。大约一半的中心至少有描述其数据集的基本文档,超过一半报告其数据已在得到适当审批的情况下用于研究。但几乎没有人将数据集放入公共仓库,几乎没有人使用使不同地点数据合并变得简单的共享技术标准。作者认为,有针对性的基础设施投资、培训和简明的治理工具包,特别是在资源不足地区,可以帮助中心朝着通用格式和更安全、更一致的数据处理迈进。

这对患者为何重要

对于患有镰状细胞病或地中海贫血的人来说,数据标准的细节听起来可能很抽象,但却有着非常现实的影响。当成千上万名患者的信息能够被合并和比较时,研究人员更有能力识别哪些治疗效果最好、应当关注哪些并发症,以及新的基因治疗在长期内的表现。本次调查表明,尽管许多血红蛋白疾病中心仍依赖分散且不一致的数据系统,但存在强烈的合作意愿——尤其是通过允许数据留在本地以保护隐私的网络。把这种意愿转化为有序、互联的数据,有望加速发现,帮助确保无论患者身处何地,都能从最佳证据中受益。

引用: Tamana, S., Yiangou, K., Orphanou, K. et al. FAIR data gaps and collaboration willingness among hemoglobinopathy research centers. Sci Data 13, 582 (2026). https://doi.org/10.1038/s41597-026-06950-9

关键词: 血红蛋白病, 罕见疾病数据, FAIR数据, 联合研究, 数据互操作性