Clear Sky Science · zh

基于PCA特征优化的混合深度神经网络以提高脑肿瘤分类

2026-02-19 · 返回目录

为何及早发现脑肿瘤至关重要

脑肿瘤是最令人畏惧的癌症之一，因为它们生长在人体的“指挥中心”内，往往在无声无息中发展，直到出现严重症状为止。医生依靠MRI扫描来发现和追踪这些肿瘤，但现代扫描设备为每位患者生成数千张高分辨率图像。无论放射科医师多么熟练，快速且一致地筛查所有这些信息仍然具有挑战性。本研究描述了一个计算机系统，通过读取脑部扫描并将其分类为四类——胶质瘤、脑膜瘤、垂体瘤或无肿瘤——其准确率可与甚至超过许多以往方法相媲美。

将复杂的扫描转换为更清晰的图像

该工作的核心在于驯服来自MRI设备的海量视觉数据。作者基于一个强大的图像识别网络DenseNet121（最初在日常照片上训练），并对其进行再训练以识别脑部扫描中的模式。在图像进入该网络之前，会对其进行细致预处理：标准化尺寸、平滑并增强对比度，以及使用聚类方法隔离出最有可能包含肿瘤的区域，该方法将相似像素归为一组。这些步骤帮助计算机聚焦于最重要的脑组织，减少噪声或背景结构的干扰。

融合多种观察肿瘤的视角

系统不仅依赖深度网络自动学习到的特征，还计算了放射科医生和工程师多年来常用的传统图像描述符。一类描述符捕捉亮暗斑块相邻的排列，突出纹理和边缘；另一类关注像素强度中的非常小的局部模式，可揭示组织的细微颗粒感；第三类则跟踪较大区域内相似强度的簇状分布，强调某一区域是平滑均匀还是斑驳不规则。将这三种视角融合为单一特征集，使模型获得比单纯深度学习更为丰富的可疑肿瘤描述。

使数据可管理且可靠

每次扫描的综合描述是极高维的，这会让学习算法困惑并导致过拟合——即模型记住训练图像而非学习通用规则。为避免此问题，作者使用一种称为主成分分析（PCA）的数学工具，在将信息输入分类网络之前将其压缩为较少的、信息量大的成分。重要的是，所有这些步骤都设计为模拟真实临床使用：每位患者的扫描要么全部保留在训练组，要么全部保留在测试组，二者绝不混合，以防模型通过两次看到相同解剖结构而作弊。网络本身包含dropout层和数据洗牌等技术，这些方法在训练期间刻意引入随机性，使最终系统对新病例更稳健。

该系统识别不同肿瘤的效果如何

研究人员在一个广泛使用的公开数据集中测试了他们的方法，共使用了超过七千张MRI图像。扫描涵盖四类：胶质瘤、脑膜瘤、垂体瘤和正常脑。采用他们的混合设计，总体准确率约为95.9%。精确率、召回率以及综合F1分数——这些衡量标签正确率和错误数的标准指标——均在约94%附近。该模型在识别垂体瘤和正常脑方面尤其出色，仅在少数情况下将边界相似的胶质瘤与脑膜瘤混淆。学习曲线显示训练和未见验证图像上的性能同步上升且无大幅差距，表明网络已避免常见的过拟合问题。

这对患者和医生意味着什么

对于非专业读者，核心信息是：将多种图像描述方法与现代深度学习网络相结合，能够将原始MRI扫描转化为关于肿瘤类型的可靠自动化建议。该系统并非用来替代放射科医师，而是作为第二双眼睛，能够在大量扫描中快速且一致地工作。通过在不同医院和不同扫描仪的数据上进行更多测试，以及在肿瘤勾画和特征选择方面的进一步改进，此类工具有望帮助更早发现危险性生长、减少错分并支持更及时的治疗决策。

引用: Pandey, B.K., Pandey, D., Lee, TF. et al. Hybrid deep neural network with PCA based features optimization for enhancing brain tumor classification. Sci Rep 16, 9968 (2026). https://doi.org/10.1038/s41598-026-39154-7

关键词: 脑肿瘤 MRI, 深度学习诊断, 医学图像分析, 肿瘤分类, 计算机辅助检测