Clear Sky Science · zh

一种用于红外图像超分辨率的轻量级混合感知增强网络

2026-01-29 · 返回目录

为日常科技带来更清晰的热感视觉

红外相机可以让我们在黑暗中、雾中或机器内部“看到”热量——但它们生成的图像通常模糊且细节不足。本文提出了一种利用人工智能来锐化这些模糊热成像的新方法，使得安防摄像头、医学扫描仪和工业检测工具在不需要更笨重或更昂贵硬件的情况下，能够揭示更清晰、更可靠的信息。

为什么红外图像难以清晰化

与智能手机相机不同，红外传感器捕捉的是不可见的热辐射而非可见光。这使它们在安防、国防、医疗和设备监控中非常有价值，可以在夜间探测到人员、发现炎症或暴露过热部件。然而，高端红外探测器通常价格昂贵、功耗高，导致传感器分辨率往往较低。超分辨率软件方法试图将粗糙、低分辨率的图像变得更清晰。传统的基于卷积的神经网络擅长捕捉局部模式（如小边缘），但难以理解图像中远距离区域之间的关联。更新的基于变换器的网络能捕获更广泛的上下文，但它们体量大、运行慢，并且往往错过细小细节（如细线和纹理）——而这些恰恰是红外场景中小目标所依赖的关键特征。

融合两种观察方式

作者提出了一个专为在细节与效率之间取得平衡而设计的新模型：混合感知增强网络（HPEN）。其核心构件——混合感知增强块——按序结合了三种思路。首先，“令牌聚合”阶段将图像中相似的块归组，使网络能够在全局层面推理场景，类似于在理解之前先对相关区域进行聚类。其次，“多尺度特征”阶段使用并行处理路径，同时观察小范围的细粒度结构和稍大范围的邻域，帮助网络同时跟踪边缘、纹理和更宽泛的形状。最后，一个简单的3×3滤波器对特征进行精化与净化，防止大范围全局操作带来的过度平滑副作用。

新锐化引擎的内部结构

从整体上看，HPEN 系统首先对低分辨率红外图像进行轻度处理以提取基础模式。然后这些信息经过一系列混合块处理，每个块通过将远程关系与小尺度细节结合，逐步加深模型对场景的理解。一条捷径连接允许原始的粗糙信息绕过这些更深的层，使网络可以将精力集中在重建缺失的高频内容上——例如清晰的边缘和小热斑。在最终阶段，一个紧凑的上采样模块将特征放大到目标分辨率，并把它们转换为与高质量参考同尺寸的锐化红外图像。整个设计有意保持轻量化，使得运算量和内存使用足够低，便于在常见图形处理器上实际部署。

该方法在实践中的表现如何

为了测试 HPEN，作者在多个公开红外数据集上进行了训练和评估，这些数据集包含城市场景、植被、车辆、行人和夜间条件。他们将其与许多近期旨在兼顾精度与效率的“轻量级”超分辨率方法进行了比较。HPEN 在标准质量指标上持续匹配或略优于这些对手，这些指标衡量锐化后图像与高分辨率参考的接近程度。在更具挑战性的四倍放大设置上表现尤其突出——把非常小的图像变成大图像时常会显露出伪影。尽管精度较高，HPEN 的计算量显著更少，占用的显存更低，并且较强的变换器类竞品具有更快的处理速度。对感知质量（更接近人类视觉判断）的额外测试显示，HPEN 的结果在外观上最接近真实的高分辨率红外图像，具有更少的边缘泛白和更好保留的纹理。

这对现实应用意味着什么

对非专业读者来说，关键结论是：HPEN 提供了一种更聪明的方式，可以在不更换硬件的情况下“增强热成像的放大”。通过在一个高效的方案中谨慎地结合全局上下文（理解整个场景）与局部细节（保留微小边缘和纹理），该方法能够在控制计算成本的同时生成更清晰、更有信息量的红外图像。这有助于安防系统在黑暗中更清楚地识别人员或车辆，使工业检查员能看到设备上的细小裂纹或热斑，并在非侵入性筛查中为医生提供更清晰的热图模式——所有这些都可在现有传感器上实现，使其“看见”的信息量显著增加。

引用: Liu, Z., Tian, J., Liu, C. et al. A lightweight hybrid perception enhancement network for infrared image super-resolution. Sci Rep 16, 6572 (2026). https://doi.org/10.1038/s41598-026-37763-w

关键词: 红外成像, 超分辨率, 深度学习, 图像增强, 计算机视觉