Clear Sky Science · zh

一种基于模型的图像融合框架:离散带限剪切小波

· 返回目录

为何更好的照片重要

任何尝试过拍摄日落或夜景天际线的人都知道那种挫败感:如果天空看起来合适,建筑物又太暗;如果建筑清晰,天空就变成一片白色模糊。本文解决的正是这个日常问题。文章提出了一种新的方法,将同一场景在不同亮度下拍摄的若干照片合成为一张既保留阴影又保留高光细节的图像,同时不依赖不透明的深度学习技巧。

Figure 1. 多张明暗不同的照片合并为一幅均衡的场景,处处细节清晰。
Figure 1. 多张明暗不同的照片合并为一幅均衡的场景,处处细节清晰。

将多张拍摄合成一幅清晰画面

现代相机传感器无法像人眼那样,同时舒适地看到明亮云层和昏暗街道的细节。摄影师常通过对同一场景拍摄一系列曝光不同的照片来规避这一点:一张欠曝以保护高亮区域、一张正常曝光、一张过曝以显示暗部区域。多重曝光图像融合的目标是将这些照片合成一张在各处都显得自然且细节丰富的图片。早期方法要么直接混合像素,要么使用简单技巧来避免重影,但它们常常产生暗淡的结果或模糊细腻纹理。

对黑箱学习的一种清晰替代方案

近年来,深度学习系统在这项任务中占据主导地位,从大型训练集学习如何融合图像。这类系统能生成引人注目的图片,但训练代价高、强依赖所用数据且难以解释。相比之下,作者提出了一个完全透明、无需训练的方法,基于成熟可理解的数学原理。不通过示例学习融合规则,而是遵循可检查、可复现、可调整的精确定义规则,这在科学、医疗或安全关键领域尤为吸引人,因为这些领域需要信任与可追溯性。

使用智能方向追踪细节

新方法的核心工具称为离散带限剪切小波变换。简单来说,这个工具将每张输入图像分解为捕获不同尺度和方向结构的层,例如边缘、直线与曲线。与以往多数在所有方向上同等对待细节的技术不同,这种变换特别擅长跟踪倾斜和弯曲特征,如屋檐线、轮廓以及水面的波纹。每个源图像首先被转换为包含整体亮度与形状的低频层,以及承载细微边缘和纹理的高频层。随后方法按照精心设计的规则融合这些层,最后重建出最终图像。

Figure 2. 来自不同曝光的方向性边缘层逐步结合,形成更清晰、平衡的图像片段。
Figure 2. 来自不同曝光的方向性边缘层逐步结合,形成更清晰、平衡的图像片段。

从每个曝光中选择保留内容

为决定在最终图像中应保留每个曝光的哪些细节,作者测试了两种简单策略。对于缓慢变化的背景内容,他们对低频层取平均,使整体亮度与场景结构看起来自然。对于细节部分,他们尝试了两种竞争思路。一条规则偏好在小邻域内变化始终强烈的区域,这有助于保留稳定的纹理并抵抗噪声。另一条规则则在每个位置简单地选择相对于周围最显著的局部变化,这可以强化边缘但可能对噪声更敏感。在标准测试场景(如运河景观与戴面具的街头艺人)上的实验表明,一旦与剪切小波变换的强方向性层结合,两条规则的表现相近。

从数值和场景中看到改进

研究团队将其方法与多种常用的图像分解工具进行了比较,包括经典的小波以及更先进的轮廓和剪切基方案。使用衡量清晰度、信息量和结构相似性的常见质量评分,他们的方法在边缘更清晰、细节更丰富方面持续优于这些旧方法。融合后的照片在船只、建筑和天空的纹理上可读性更高,这些在原始曝光中要么被炫光淹没,要么埋在阴影中。尽管该方法在频域中使用大量方向滤波器,速度比一些替代方法慢,但在视觉质量与可解释性比速度更重要的离线处理场景中仍然实用。

对更好更清晰图像的意义

简而言之,这项工作表明,一个精心设计的数学工具可以在无需训练数据的情况下,与甚至超越传统和基于学习的方法,完成多重曝光照片的融合。通过关注边缘与纹理在不同尺度与方向上的表现,该方法能够提取每张输入拍摄中最优的部分并将其编织成一幅均衡的图像。对于需要可信、可复现图像增强的摄影师、工程师和科学家而言,它提供了一条清晰、解释充分的路径,通向更接近人眼自然所见的高动态范围图像。

引用: Ji, W., Chen, X. A model-based image fusion framework using discrete band-limited shearlets. Sci Rep 16, 15204 (2026). https://doi.org/10.1038/s41598-025-34942-z

关键词: 多重曝光图像融合, 高动态范围成像, 剪切小波变换, 图像细节增强, 计算摄影学