Clear Sky Science · zh

基于机器学习的cfDNA片段化分析:使用自动毛细管电泳进行肝细胞癌早期检测

· 返回目录

这对肝病患者为何重要

对数以百万计患有慢性肝炎或肝脏瘢痕(肝纤维化)的人来说,最大的威胁往往是无声的:肝癌在被发现之前可能悄然生长,导致可供选择的治疗变得有限。该研究提出了一种基于血液的检测方法,称为CEliver,旨在通过读取血液中循环微小DNA片段的细微模式来早期发现肝癌。由于它使用的是许多医院已有的设备并避免了昂贵的全基因组测序,因而有望使先进的癌症筛查在日常门诊中更易获得。

血液中漂浮的微小DNA线索

我们的血液携带着细胞死亡并分解时释放的小片段DNA。在健康人群中,这些片段多数尺寸相似,但癌细胞往往释放更短且更不规则的片段。研究人员将注意力集中在肝细胞癌——最常见的原发性肝癌形式——这类癌常发生于慢性肝病患者,如慢性乙型肝炎。他们的设想是,如果能够精确测量这些DNA片段的尺寸分布,可能就能将早期肝癌患者与仅处于高风险但尚无癌症的人区分开来。

Figure 1
Figure 1.

把常规实验室设备变成智能检测器

研究团队没有依赖全基因组测序,而是采用了自动毛细管电泳——一种常规实验室技术,可按尺寸分离DNA并以一条曲线报告在每一长度处出现的DNA量。从每份血样中,他们生成了详细的无细胞游离DNA谱,包括总DNA浓度、最常见的片段长度,以及在大约50到250碱基对之间的20个尺寸“窗口”中信号强度。他们随后构建了300多个数值特征,以多种方式描述短片段与长片段的平衡,捕捉单一汇总指标可能遗漏的细微变化。

教会模型识别早期肝癌

为了将这些模式转化为实用检测,研究人员将片段特征与已用于肝癌筛查的血液标志物甲胎蛋白(alpha-fetoprotein)水平结合,训练出名为CEliver的机器学习模型。他们用111人的样本开发了该模型:71名为高风险但无癌的慢性肝病个体,和40名不同分期的肝细胞癌患者。模型学习了哪些片段模式和甲胎蛋白组合能最好地区分两组。在这个开发集里,CEliver总体上正确识别了98%的肝癌病例并识别了96%的早期病例,同时仅将1%的高风险但无癌个体误判为阳性。

Figure 2
Figure 2.

在类真实世界条件下评估性能

随后团队在一组独立的69名未参与训练的人群上测试了固定的CEliver模型:其中27名为肝癌患者,30名为高风险个体,12名为健康志愿者。使用单一的阈值评分,模型检测到85%的所有肝癌患者和88%的早期肝癌患者,同时正确将所有高风险和健康者标记为无癌。相比之下,仅使用标准血液标志物只能检测到大约一半的癌症病例,并且遗漏了大多数早期肿瘤,尤其是小于2厘米的病变。在若干患者中,CEliver在影像学确认肿瘤之前数月就提示可能存在癌症,表明片段模式的变化可能早于可见肿瘤生长。

这对患者可能意味着什么

研究表明,一种相对简单的血液检测方法,基于广泛可用的实验室硬件和先进的数据分析,能以高准确性在更早、更易治疗的阶段检测肝癌。对于患有慢性肝炎或肝脏瘢痕的人来说,这一方法未来可能比现有的超声检查和单一血液标志物提供更灵敏且可扩展的癌症监测方式。尽管仍需更大、更多样化的人群研究,CEliver展示了通过细致解读无细胞游离DNA模式,将其纳入常规随访以保护高危患者免受这种致命肝病侵害的潜力。

引用: Udomruk, S., Sutthitthasakul, S., Bunsermvicha, N. et al. Machine learning–based cfDNA fragmentation profiling using automated capillary electrophoresis for early detection of hepatocellular carcinoma. Commun Med 6, 166 (2026). https://doi.org/10.1038/s43856-026-01437-5

关键词: 肝癌筛查, 无细胞游离DNA, 肝细胞癌, 早期癌症检测, 机器学习诊断