Clear Sky Science · fr

Un modèle hybride pour la détection de falsification d'images utilisant l'apprentissage profond avec des méthodes par blocs et points-clés

· Retour à l’index

Pourquoi les modifications cachées dans les photos comptent

Les photos façonnent ce que nous croyons du monde, qu'il s'agisse de l'actualité, de la politique, de preuves médicales ou de décisions judiciaires. Pourtant, les outils d'édition modernes peuvent altérer une image de manière si convaincante que même des yeux entraînés peuvent ne rien remarquer. Cet article présente une nouvelle méthode, appelée HDBK, qui repère un type fréquent de tromperie connu sous le nom de falsification par copie–collage (copy–move) — où une partie d'une image est copiée et collée ailleurs dans la même image pour masquer ou dupliquer des objets. L'objectif est de fournir aux enquêteurs un outil à la fois précis et suffisamment rapide pour être utile en contexte judiciaire réel.

Figure 1
Figure 1.

Un problème croissant de confiance dans les photos numériques

Chaque année, des milliards de photos sont prises et partagées via téléphones, réseaux sociaux et systèmes professionnels. Parallèlement, des applications d'édition faciles d'utilisation permettent à presque n'importe qui de supprimer des personnes d'une scène, de cloner des objets ou de modifier subtilement des détails importants. Dans la falsification copy–move, un acteur malveillant peut dissimuler des preuves en copiant un tronçon propre de route sur des traces de freinage, ou dupliquer une foule pour faire paraître un événement plus important. Parce que ces régions copiées proviennent de la même image, elles correspondent naturellement à l'éclairage, aux couleurs et à la texture de l'image, ce qui les rend particulièrement difficiles à détecter à l'œil nu ou avec des vérifications logicielles simples.

Les anciens outils et leurs faiblesses

Les méthodes de détection existantes recherchent des indices de différentes manières. Les méthodes basées sur des blocs découpent l'image en nombreux petits patchs et les comparent pour trouver des régions suspectes. Cela peut fonctionner, mais vérifier chaque paire possible de patchs est lent et peine lorsque les falsificateurs font pivoter ou redimensionner les parties copiées, ou appliquent un flou ou une compression ensuite. Les méthodes par points-clés cherchent plutôt des points distinctifs — comme des coins ou des zones texturées — et les comparent, ce qui est plus rapide et plus tolérant aux transformations géométriques. Cependant, elles échouent souvent sur des zones falsifiées lisses ou très petites qui contiennent peu de points distinctifs. L'apprentissage profond, où les réseaux neuronaux apprennent leurs propres caractéristiques à partir de données, peut repérer des falsifications au niveau de l'image entière ou au niveau pixel, mais exige généralement de grands ensembles de données étiquetées avec soin, coûteux à produire pour la criminalistique.

Une stratégie hybride en trois étapes

Les auteurs proposent HDBK, un système hybride qui mêle les atouts de l'apprentissage profond, de l'analyse par blocs et de la correspondance par points-clés tout en atténuant leurs faiblesses respectives. Dans la première étape, trois réseaux neuronaux bien connus — VGG16, MobileNet et EfficientNetB0 — sont combinés en un modèle à trois branches. Entraîné sur une base d'images authentiques et falsifiées, cet ensemble décide rapidement si une image est probablement falsifiée et produit une carte thermique : une superposition colorée qui met en évidence les régions que le réseau juge suspectes. Plutôt que de s'appuyer sur des masques dessinés manuellement pendant l'entraînement, le système apprend à partir d'étiquettes au niveau de l'image seulement, puis utilise ses cartes de caractéristiques internes pour localiser les zones probablement altérées.

Figure 2
Figure 2.

Zoomer pour identifier précisément la falsification

Une fois que la carte thermique isole une région suspecte, HDBK resserre sa recherche. Un bloc autour de la zone vraisemblablement falsifiée est sélectionné, retiré de l'image, et une recherche par blocs plus sophistiquée est lancée pour trouver l'origine de ce contenu copié. Au lieu de comparer exhaustivement chaque bloc possible, la méthode utilise un algorithme génétique — une technique d'optimisation inspirée de l'évolution — pour explorer uniquement les positions et tailles de blocs les plus prometteuses. La qualité de chaque candidat est mesurée par le nombre de points caractéristiques correspondants qu'il partage avec le bloc suspect, en combinant trois détecteurs de points-clés (SIFT, SURF et FAST). Après avoir trouvé la meilleure correspondance, le système relie les points-clés correspondants et trace un polygone serré autour des régions source et collée, affinant les formes avec des filtres morphologiques pour produire un masque binaire propre de la zone falsifiée.

Performance de la méthode

Pour évaluer HDBK, les auteurs ont utilisé le jeu de données CoMoFoD, une collection largement utilisée de falsifications copy–move qui inclut des cas difficiles : zones copiées petites et lisses, rotations, redimensionnements, floutage, ajout de bruit, variations de luminosité et compression JPEG agressive. Au niveau de l'image, le réseau profond hybride a correctement classé les images falsifiées versus authentiques avec environ 99 % de précision, surpassant plusieurs autres modèles modernes. Au niveau pixel, où chaque pixel est jugé authentique ou falsifié, HDBK a atteint une forte précision globale et un bon recouvrement avec les masques de référence, tout en maintenant un faible taux de fausses alertes. Même sous des conditions difficiles comme un fort flou, du bruit et une forte compression, le système a conservé une performance robuste, révélant à la fois la localisation et la forme des régions falsifiées.

Ce que cela signifie pour la confiance quotidienne dans les photos

En termes simples, cette recherche propose un détective plus intelligent pour les images numériques. En utilisant d'abord des réseaux profonds pour souligner grossièrement où quelque chose semble suspect, puis en appliquant une recherche par blocs optimisée et une correspondance par points-clés pour retracer précisément ce qui a été copié et d'où cela provient, HDBK peut découvrir de façon fiable des retouches cachées pouvant influencer des décisions juridiques, des reportages ou des diagnostics médicaux. Bien que des falsifications extrêmement petites ou dépourvues de texture restent un défi, et que des travaux supplémentaires soient nécessaires pour étendre la méthode au-delà du copy–move vers d'autres types de manipulation, cette approche hybride marque une étape importante vers la restauration de la confiance dans ce que nous voyons à l'écran.

Citation: Mehrjardi, F.Z., Zarchi, M.S. A hybrid model for image forgery detection using deep learning with block and keypoint methods. Sci Rep 16, 11169 (2026). https://doi.org/10.1038/s41598-026-41473-8

Mots-clés: détection de falsification d'images, manipulation copy-move, apprentissage profond, criminalistique numérique, authenticité des images