Clear Sky Science · zh

基于改进孤立森林算法的高光谱图像异常检测

· 返回目录

在卫星影像中看见不可见之物

现代卫星不仅拍摄地球的漂亮图像;它们记录了我们肉眼看不到的数百种光谱颜色。在这道信息彩虹中隐藏着矿井塌陷、油污泄漏或军事伪装的早期预警信号。本文总结了一种新的自动化方法,用于从这些高光谱图像中发现微小且异常的模式——使得无需大量人工分析就能更容易地发现地面上微小且有风险的变化。

Figure 1
Figure 1.

为何额外的颜色能揭示隐藏目标

普通卫星照片只包含三种基本颜色:红、绿、蓝。相比之下,高光谱图像记录了数十乃至数百个窄波段的颜色。每个像素携带一个详细的“光谱指纹”,反映其组成——土壤、岩石、植被、金属、水体或污染物。挑战在于这些数据立方体体量巨大、噪声多,并且常被大气、传感器与复杂地形带来的冗余信息所混淆。在这种情况下的异常检测意味着在不事先知道目标是什么的情况下,从周围背景中挑出少数显著不同的像素。这些稀有像素可能预示矿井地面下沉、污染羽流或伪装设备,因此可靠且快速地检测它们对环境监测与安全至关重要。

从简单的树到更聪明的森林

该研究基于孤立森林,一种用于发现异常点的机器学习方法。在基本的孤立森林中,数据被反复随机拆分,形成一系列决策树。异常点往往在很少的拆分中就被孤立,而正常背景像素则需要更多拆分。这一思想在中等规模数据中效果良好,但高光谱场景包含数百个波段、大量噪声以及非常微妙的异常。随机选择特征可能会浪费计算资源在冗余波段上,模糊目标与背景之间的对比,并提升误报率。因此,作者通过让森林看到更干净的数据,并既在全局也在局部邻域中评估像素,来重新设计该方法。

以多尺度视觉锐化图像

为了在检测前清理并压缩数据,该方法首先应用一种称为Godec的低秩-稀疏分解。通俗地说,这将图像分为平滑的背景层和包含尖锐、异常信号的稀疏层。其上,作者利用了有趣目标常在光谱上以及空间排列上同时突出这一事实。他们使用三维Gabor滤波器,像对高光谱立方体滑动的纹理敏感透镜,用以强调不同尺度和方向的模式。随后,熵率超像素算法将相邻像素分组成小且一致的区域。通过调节这些区域的细致程度,该方法能抑制随机噪声,同时保留真实结构,如坑洞、裂缝或人工构造物。

Figure 2
Figure 2.

结合全局与局部线索

在提取出清洁的光谱与空间特征后,改进的孤立森林为每个像素分配一个异常评分。该方法不仅依赖像素在整个数据集中被孤立的速度,还检查其与邻域内部的一致性。全球看起来正常但在局部异常的像素,或反之,都会通过联合评分规则重新评估。这种两层视角既减少了漏检,也降低了由复杂背景引起的伪异常。对两个广泛使用的高光谱数据集(San Diego 和 HYDICE)的测试表明,新方法实现了较高的准确性(AUC 约为 0.97,F1 约为 0.94),同时将误报率保持在很低水平,并维持了合理的内存使用与处理速度。

从实验室测试到现实世界监测

作者进一步在矿区地面塌陷和生态监测任务中,利用卫星与机载数据验证了他们的方法。在矿区,系统正确标记了超过 95% 与塌陷相关的异常,同时仅漏检约 4%。在环境监测中,它检测出近 94% 的可疑区域,如受扰动的植被或可能的伪装,同样仅漏检少数百分比。与若干既有技术相比,改进的森林在各类场景中既更灵敏也更稳定。对非专业读者来说,结论是:通过谨慎清理数据、在多尺度上观察模式并融合全局与局部判断,我们可以将高光谱图像转化为一种强大的自动“早期预警”工具,用于检测地面上重要的变化。

引用: Li, A. Anomaly detection of hyperspectral images based on improved isolation forest algorithm. Sci Rep 16, 6171 (2026). https://doi.org/10.1038/s41598-026-36548-5

关键词: 高光谱成像, 异常检测, 遥感, 孤立森林, 环境监测