Clear Sky Science · zh
一种用于红外图像超分辨率的轻量级混合感知增强网络
为日常科技带来更清晰的热感视觉
红外相机可以让我们在黑暗中、雾中或机器内部“看到”热量——但它们生成的图像通常模糊且细节不足。本文提出了一种利用人工智能来锐化这些模糊热成像的新方法,使得安防摄像头、医学扫描仪和工业检测工具在不需要更笨重或更昂贵硬件的情况下,能够揭示更清晰、更可靠的信息。

为什么红外图像难以清晰化
与智能手机相机不同,红外传感器捕捉的是不可见的热辐射而非可见光。这使它们在安防、国防、医疗和设备监控中非常有价值,可以在夜间探测到人员、发现炎症或暴露过热部件。然而,高端红外探测器通常价格昂贵、功耗高,导致传感器分辨率往往较低。超分辨率软件方法试图将粗糙、低分辨率的图像变得更清晰。传统的基于卷积的神经网络擅长捕捉局部模式(如小边缘),但难以理解图像中远距离区域之间的关联。更新的基于变换器的网络能捕获更广泛的上下文,但它们体量大、运行慢,并且往往错过细小细节(如细线和纹理)——而这些恰恰是红外场景中小目标所依赖的关键特征。
融合两种观察方式
作者提出了一个专为在细节与效率之间取得平衡而设计的新模型:混合感知增强网络(HPEN)。其核心构件——混合感知增强块——按序结合了三种思路。首先,“令牌聚合”阶段将图像中相似的块归组,使网络能够在全局层面推理场景,类似于在理解之前先对相关区域进行聚类。其次,“多尺度特征”阶段使用并行处理路径,同时观察小范围的细粒度结构和稍大范围的邻域,帮助网络同时跟踪边缘、纹理和更宽泛的形状。最后,一个简单的3×3滤波器对特征进行精化与净化,防止大范围全局操作带来的过度平滑副作用。
新锐化引擎的内部结构
从整体上看,HPEN 系统首先对低分辨率红外图像进行轻度处理以提取基础模式。然后这些信息经过一系列混合块处理,每个块通过将远程关系与小尺度细节结合,逐步加深模型对场景的理解。一条捷径连接允许原始的粗糙信息绕过这些更深的层,使网络可以将精力集中在重建缺失的高频内容上——例如清晰的边缘和小热斑。在最终阶段,一个紧凑的上采样模块将特征放大到目标分辨率,并把它们转换为与高质量参考同尺寸的锐化红外图像。整个设计有意保持轻量化,使得运算量和内存使用足够低,便于在常见图形处理器上实际部署。

该方法在实践中的表现如何
为了测试 HPEN,作者在多个公开红外数据集上进行了训练和评估,这些数据集包含城市场景、植被、车辆、行人和夜间条件。他们将其与许多近期旨在兼顾精度与效率的“轻量级”超分辨率方法进行了比较。HPEN 在标准质量指标上持续匹配或略优于这些对手,这些指标衡量锐化后图像与高分辨率参考的接近程度。在更具挑战性的四倍放大设置上表现尤其突出——把非常小的图像变成大图像时常会显露出伪影。尽管精度较高,HPEN 的计算量显著更少,占用的显存更低,并且较强的变换器类竞品具有更快的处理速度。对感知质量(更接近人类视觉判断)的额外测试显示,HPEN 的结果在外观上最接近真实的高分辨率红外图像,具有更少的边缘泛白和更好保留的纹理。
这对现实应用意味着什么
对非专业读者来说,关键结论是:HPEN 提供了一种更聪明的方式,可以在不更换硬件的情况下“增强热成像的放大”。通过在一个高效的方案中谨慎地结合全局上下文(理解整个场景)与局部细节(保留微小边缘和纹理),该方法能够在控制计算成本的同时生成更清晰、更有信息量的红外图像。这有助于安防系统在黑暗中更清楚地识别人员或车辆,使工业检查员能看到设备上的细小裂纹或热斑,并在非侵入性筛查中为医生提供更清晰的热图模式——所有这些都可在现有传感器上实现,使其“看见”的信息量显著增加。
引用: Liu, Z., Tian, J., Liu, C. et al. A lightweight hybrid perception enhancement network for infrared image super-resolution. Sci Rep 16, 6572 (2026). https://doi.org/10.1038/s41598-026-37763-w
关键词: 红外成像, 超分辨率, 深度学习, 图像增强, 计算机视觉