Clear Sky Science · zh

通过整合生物信息学分析和实时PCR验证鉴定肺腺癌的诊断和预后生物标志物

· 返回目录

为何及早发现肺癌至关重要

肺癌是致死率最高的癌症之一,部分原因在于它常常被发现得太晚。最常见的类型——肺腺癌,可能在多年内悄无声息生长而不引起症状。本研究探索血液和肿瘤组织中的模式能否更早揭示疾病。研究者通过将大规模基因数据与人工智能结合,并在真实患者中进行二次验证,目标是找到简单的血液标志物,未来可帮助医生更早检测肺癌并指导治疗。

在基因中寻找警示信号

研究团队首先使用了来自522名受试者的RNA测序数据,其中506名为肺腺癌患者,16名为健康对照。RNA是基因的“工作副本”,反映了细胞中哪些基因被开启或关闭。经过仔细清洗和标准化处理后,他们比较了癌症样本与非癌样本之间的基因活性水平,发现有3,513个基因在患者中表达显著不同。这些差异表达基因构成了计算模型的原始材料,模型可以基于基因模式学会区分癌变和健康组织。

Figure 1
Figure 1.

教计算机识别癌症

为了解析成千上万的基因,研究者采用了深度学习方法,这是一种受大脑细胞网络启发的人工智能技术。他们构建了具有多层隐藏层的神经网络,输入基因表达数据并学习将每个样本分类为癌性或健康。模型在大部分数据上进行训练,然后在一部分从未见过的数据上进行测试。结果令人瞩目:系统以约98%的准确率正确识别病例与对照,曲线下面积为1.0(接近完美得分),并在概率估计上具有极低的误差率。从该模型中他们提取出对决策贡献最大的20个基因,突出了可供进一步研究的短名单候选基因。

从计算机预测到真实血液检测

在大型数据库中发现基因模式只有在这些模式在真实人群中出现时才有意义。为此,研究者收集了30名肺腺癌患者(均为早期至中期且未接受既往治疗)和30名按年龄与性别匹配的健康志愿者的血液样本。使用称为实时PCR的实验室方法,他们测量了几种预测标志基因在血细胞中的表达强度。其中四个基因尤其显著:CYP2C9、KRT14和PECAM1在患者血液中表达明显更高,而A2M表达较低。例如,患者中CYP2C9的水平约高出四倍,KRT14约高出八倍,而A2M约为健康者的一半。这些明显差异表明,针对这些标志物的组合血液检测有望帮助区分谁患有肺腺癌。

Figure 2
Figure 2.

关于预后和疾病行为的线索

研究不仅限于简单的阳性或阴性诊断。通过将基因表达与肿瘤大小、转移、分期和患者生存等临床信息联系起来,团队识别出可能预测癌症行为的基因。包括CYP2C9、KCNV1、KRT24、SIRPD、PECAM1以及一个非编码基因LOC730668在内的若干基因与患者预后相关。有些基因似乎与为肿瘤供血的血管生成有关,另一些则与癌细胞如何与免疫系统相互作用或抵抗细胞死亡有关。在多个独立数据集中进行的外部验证显示,这些候选标志物大多表现一致,增加了这些发现不是单一数据集偶然结果的信心。

这对患者可能意味着什么

简单来说,这项工作表明,五个基因的智能组合——A2M、CYP2C9、KCNV1、KRT24和SIRPD——在基因数据中可以高灵敏度地提示肺腺癌,并且其中至少四个在血液中显示出明确的可测量变化。尽管这些标志物尚未达到常规筛查的水平,但它们为未来能够更早检测肺癌的血液检测提供了有希望的蓝图,使得在更可治愈的阶段发现疾病成为可能。它们还可能帮助医生评估肿瘤的侵袭性并相应地调整治疗。需要在更大且更具多样性的患者群体中进行进一步研究,但结果表明,人工智能与严格的实验室验证相结合,可以加速寻找实用、微创抗癌工具的进程。

引用: Hossein Zadeh, R., Hossein Zadeh, R., Hajimoradi, M. et al. Identification of diagnostic and prognostic biomarkers in lung adenocarcinoma through integrated bioinformatics analysis and real time PCR validation. Sci Rep 16, 6679 (2026). https://doi.org/10.1038/s41598-026-35971-y

关键词: 肺腺癌, 生物标志物, 深度学习, 血液检测, 早期癌症检测