Clear Sky Science · zh

用于系统性硬化临床分型的光谱学与机器学习方法

· 返回目录

为什么为一种罕见病做血液检测很重要

系统性硬化是一种罕见的自身免疫性疾病,会导致皮肤和内脏器官瘢痕化,经常损害肺部和血管。临床医生难以预测哪些患者会发展为最严重的病型,因为现有的血液检测只能提供部分信息。本研究探讨了一种快速、无创的检测方法:将红外光照射到一滴血样上并结合计算机分析,是否能将患者划分为更精确的亚组,并在未来指导治疗决策。

Figure 1
Figure 1.

在一滴血中寻找隐匿线索

研究者没有只寻找某一种特定分子,而是使用了被称为红外光谱学的技术,它能同时读取血液中多种化学物质的综合“指纹”。每种分子——例如脂肪、蛋白质和糖——对红外光的吸收略有不同。通过在59例系统性硬化患者中测量这些模式,研究团队考察了血液的整体化学成分是否在两种主要病型(弥漫型与局限型)之间存在差异,以及有无间质性肺病(肺部瘢痕)患者之间是否存在差别。

脂类和蛋白质的微妙差异

红外测量显示了一系列对应血液主要成分的吸收峰,包括蛋白质和脂质(脂肪)的构成基块。当研究者对患者的光谱求平均时,在与蛋白质构象和血液脂类相关的波段中观察到小但一致的位移。比较弥漫型与局限型时这些差异更明显,在有无肺损害的比较中差异则较弱。然而,当仅看单个峰的强度或简单的峰比时,这些差异单独并不足以达到有力的统计显著性。

Figure 2
Figure 2.

让计算机发现人眼看不到的模式

为了更深入挖掘数据,团队采用了多变量统计和机器学习方法。首先,他们使用一种能将数千个红外数据点压缩为少数坐标的新方法,这些坐标捕捉了样本之间的大部分变异。在这个降维空间中,两种病型的样本沿主轴呈现出分群趋势,提示存在真实的生化差异,尽管仍有明显重叠。随后,研究者训练了多种计算模型来对血液光谱进行分类,包括决策树、k近邻、支持向量机、神经网络和随机森林。经过细致调参,这些模型在区分弥漫型与局限型方面达到了中等准确度,其中随机森林表现最佳,而基于肺部瘢痕或其他临床特征的区分则较弱。

一种新兴血检的希望与局限

尽管机器学习模型的表现优于随机猜测,但其可靠性和给出稳健概率的能力尚不足以进入常规临床使用。结果受限于样本量有限和组间不平衡,这可能导致某些模型偏向于常见的亚型。作者强调需要更好的光谱预处理、更聪明地选择最具信息量的波段,以及更大且更多样化的患者队列。他们还建议将红外“指纹”与代谢组学或蛋白质谱等其他现代技术结合,以增强信号。

这对患者可能意味着什么

对于系统性硬化患者来说,这项工作并不会立即改变诊断或治疗,但它指向了一个未来:一种简单、低成本的血液检测或可帮助临床医生将患者划分为具有生物学意义的亚组,并早期发现肺部损害的迹象。研究表明,血液的整体化学特征包含关于疾病行为的信息,而智能算法可以开始读取这些特征。经过进一步改进和更大规模研究,这种方法有望成为现有检测的有益补充,改善风险评估并推动更个体化的治疗。

引用: Miziołek, B., Miszczyk, J., Paja, W. et al. Spectroscopic and machine learning approaches for clinical subtyping in systemic sclerosis. Sci Rep 16, 6929 (2026). https://doi.org/10.1038/s41598-026-37690-w

关键词: 系统性硬化, 红外光谱学, 血液生物标志物, 机器学习, 间质性肺疾病