Clear Sky Science · zh
一种结合块与关键点方法的深度学习图像伪造检测混合模型
照片中隐蔽篡改为何重要
照片塑造了我们对世界的认知,无论是新闻与政治,还是医疗证据和法庭裁决。然而,现代编辑工具可以如此逼真地改变图像,以至于即便是训练有素的眼睛也可能察觉不到。本文提出了一种名为 HDBK 的新方法,用于识别一种常见的伪造手法——复制-移动伪造(将图片的一部分复制并粘贴到同一图像的其他位置以隐藏或复制对象)。目标是为调查人员提供一种既准确又足够快速、可用于实际取证工作的工具。

数字照片信任危机在加剧
每年都有数十亿张照片被拍摄并在手机、社交媒体和专业系统中传播。与此同时,易用的编辑应用让几乎任何人都能从场景中移除人物、克隆对象或微妙地更改重要细节。在复制-移动伪造中,作恶者可能会用干净的路面贴到刹车痕迹上以掩盖证据,或复制人群以使活动看起来更大。由于被复制的区域来自同一图像,它们在光照、颜色与纹理上自然匹配,这使得肉眼或简单软件检测很难识别。
传统工具的弱点
现有检测方法通过不同途径寻找线索。基于块的方法将图像切成许多小块并比较它们以发现可疑的相似区域。这种方法可行,但检查每一对块的成本很高,在伪造者旋转或缩放复制部分,或者在随后进行模糊与压缩时会表现不佳。基于关键点的方法则搜寻具有辨识度的点——如角点或纹理点——并进行比较,这速度更快且对几何变换更有容错性。然而,对于平滑或非常小且缺乏显著关键点的伪造区域,它们常常失效。深度学习则通过神经网络从数据中学习特征,能够在整图或像素级别上识别伪造,但通常需要大量、精确标注的数据集,这在取证场景中代价高昂。
三步混合策略
作者提出了 HDBK,一种将深度学习、块分析与关键点匹配优点融合,同时减少各自弱点的混合系统。第一步,三种知名神经网络——VGG16、MobileNet 与 EfficientNetB0——被组合成单一的三分支模型。在包含真图与伪造图的基准数据上训练后,该集成模型能快速判断图像是否可能被伪造,并生成热图:一种突出网络认为可疑区域的彩色覆盖图。系统不依赖手工绘制的掩码进行训练,而是仅用图像级标签学习,然后利用内部特征图定位可能被篡改的区域。

放大以准确定位伪造
一旦热图分离出可疑区域,HDBK 会缩小搜索范围。系统选取围绕疑似伪造区的一个块,将其从图像中移除,并启动更智能的基于块的搜索以寻找该内容的来源。方法不逐一穷举所有可能块,而是使用遗传算法——一种受进化启发的优化技术——仅探索最有前景的块位置与尺寸。每个候选块的质量通过其与可疑块共享的匹配特征点数量来度量,使用三种关键点检测器(SIFT、SURF 与 FAST)组合评估。找到最佳匹配后,系统连接对应关键点并在源区与粘贴区周围绘制紧密多边形,最后用形态学滤波精炼形状,生成干净的二值掩码以标示被篡改区域。
方法的性能如何
为评估 HDBK,作者使用了 CoMoFoD 数据集——一个广泛使用的复制-移动伪造集合,包含具有挑战性的案例:小而平滑的复制区域、旋转、缩放、模糊、加入噪声、亮度变化以及强烈的 JPEG 压缩。在图像级别上,该混合深度网络以约 99% 的准确率正确区分伪造与真实图像,优于若干其他现代模型。在像素级别上(对每个像素判定真伪),HDBK 达到了很高的整体准确性并与真实掩码有很强的重叠,同时保持很低的误报率。即便在强模糊、噪声与压缩等艰难条件下,系统仍能保持稳健性能,揭示伪造区域的位置与形状。
这对日常照片信任意味着什么
简而言之,这项研究为数码图像提供了更智能的“侦探”。通过先用深度网络粗略标出视觉异常的区域,再用优化的基于块搜索与关键点匹配精确追踪何处被复制及其来源,HDBK 能可靠发现可能影响法律判决、新闻报道或医疗诊断的隐蔽编辑。尽管极小或无纹理的伪造仍然具有挑战性,且还需进一步工作以将方法扩展到除复制-移动之外的其它篡改类型,但这种混合方法标志着朝着恢复我们屏幕上所见可信度的重要一步。
引用: Mehrjardi, F.Z., Zarchi, M.S. A hybrid model for image forgery detection using deep learning with block and keypoint methods. Sci Rep 16, 11169 (2026). https://doi.org/10.1038/s41598-026-41473-8
关键词: 图像伪造检测, 复制-粘贴操控, 深度学习, 数字取证, 图像真实性