Clear Sky Science · de

Ein Hybridmodell zur Erkennung von Bildfälschungen mithilfe von Deep Learning kombiniert mit Block- und Keypoint-Methoden

2026-02-26 · Zurück zur Übersicht

Warum versteckte Veränderungen in Fotos wichtig sind

Fotos prägen unser Weltbild — von Nachrichten und Politik bis hin zu medizinischen Befunden und gerichtlichen Entscheidungen. Moderne Bildbearbeitungswerkzeuge können jedoch ein Bild so überzeugend verändern, dass selbst geschulte Augen nichts bemerken. Dieses Paper stellt eine neue Methode namens HDBK vor, die eine häufige Manipulationsart erkennt: Copy–Move-Fälschung — dabei wird ein Bildbereich innerhalb desselben Bildes kopiert und an anderer Stelle eingefügt, um Objekte zu verbergen oder zu duplizieren. Ziel ist es, Ermittlern ein Werkzeug zur Verfügung zu stellen, das sowohl genau als auch schnell genug für den praktischen forensischen Einsatz ist.

Ein wachsendes Vertrauensproblem bei digitalen Fotos

Jedes Jahr werden Milliarden von Fotos mit Telefonen, in sozialen Medien und in professionellen Systemen aufgenommen und geteilt. Zugleich erlauben benutzerfreundliche Editier-Apps fast jedem, Personen aus einer Szene zu entfernen, Objekte zu klonen oder wichtige Details subtil zu verändern. Bei Copy–Move-Fälschungen könnte ein Täter beispielsweise saubere Straßenbereiche über Bremsspuren legen oder eine Menschenmenge duplizieren, um eine Veranstaltung größer erscheinen zu lassen. Da die kopierten Bereiche aus demselben Bild stammen, passen Belichtung, Farbe und Textur natürlich zusammen, weshalb sie mit bloßem Auge oder einfachen Softwareprüfungen besonders schwer zu erkennen sind.

Alte Werkzeuge und ihre Schwächen

Bestehende Erkennungsansätze suchen Hinweise auf unterschiedliche Weise. Blockbasierte Verfahren teilen das Bild in viele kleine Patches und vergleichen diese, um verdächtig ähnliche Regionen zu finden. Das kann funktionieren, ist aber langsam, weil alle möglichen Patch-Paare geprüft werden müssen, und hat Probleme, wenn Fälscher die kopierten Teile drehen, skalieren oder das Bild später verwischen bzw. komprimieren. Keypoint-basierte Methoden suchen stattdessen nach markanten Punkten — etwa Ecken oder strukturierten Stellen — und vergleichen diese, was schneller ist und geometrische Änderungen besser toleriert. Allerdings versagen sie oft bei glatten oder winzigen manipulierten Bereichen, die nur wenige markante Punkte enthalten. Deep Learning, bei dem neuronale Netze ihre Merkmale aus Daten lernen, kann Fälschungen sowohl auf Bild- als auch auf Pixelebene erkennen, verlangt jedoch in der Regel große, sorgfältig annotierte Datensätze, deren Erstellung in der Forensik teuer ist.

Eine dreistufige Hybridstrategie

Die Autoren schlagen HDBK vor, ein hybrides System, das die Stärken von Deep Learning, Blockanalyse und Keypoint-Matching vereint und zugleich deren Schwächen verringert. Im ersten Schritt werden drei bekannte neuronale Netze — VGG16, MobileNet und EfficientNetB0 — zu einem dreigleisigen Modell kombiniert. Auf einem Benchmark mit echten und manipulierten Bildern trainiert, entscheidet dieses Ensemble schnell, ob ein Bild möglicherweise gefälscht ist, und erzeugt eine Heatmap: eine Farbübergangsüberlagerung, die die Regionen hervorhebt, die das Netzwerk für verdächtig hält. Statt während des Trainings auf handgezeichnete Masken zu vertrauen, lernt das System ausschließlich aus Bild-Labels und nutzt interne Feature-Maps, um wahrscheinlich manipulierte Bereiche zu lokalisieren.

Hineinzoomen, um die Fälschung punktgenau zu finden

Sobald die Heatmap eine verdächtige Region eingrenzt, verfeinert HDBK die Suche. Ein Bereich um die mutmaßlich gefälschte Stelle wird ausgewählt, aus dem Bild ausgeschnitten und eine gezieltere blockbasierte Suche gestartet, um die Quelle des kopierten Inhalts zu finden. Anstatt jeden möglichen Block exhaustiv zu vergleichen, nutzt die Methode einen genetischen Algorithmus — eine von der Evolution inspirierte Optimierungstechnik — um nur die vielversprechendsten Blockpositionen und -größen zu erkunden. Die Qualität jedes Kandidaten wird daran gemessen, wie viele übereinstimmende Feature-Punkte er mit dem verdächtigen Block teilt; dabei werden drei Keypoint-Detektoren (SIFT, SURF und FAST) kombiniert. Nach dem Finden der besten Übereinstimmung koppelt das System entsprechende Keypoints und zeichnet ein enges Polygon um sowohl Quell- als auch eingefügte Bereiche; die Form wird mit morphologischen Filtern verfeinert, um eine saubere binäre Maske des manipulierten Bereichs zu erzeugen.

Wie gut die Methode abschneidet

Zur Prüfung von HDBK verwendeten die Autoren den CoMoFoD-Datensatz, eine weit verbreitete Sammlung von Copy–Move-Fälschungen, die herausfordernde Fälle enthält: kleine und glatte kopierte Bereiche, Drehungen, Skalierungen, Verwischungen, hinzugefügtes Rauschen, Helligkeitsänderungen und starke JPEG-Kompression. Auf Bildebene klassifizierte das hybride Deep-Netz gefälschte gegenüber echten Bildern mit etwa 99 % Genauigkeit und übertraf mehrere andere moderne Modelle. Auf Pixelebene, wo jedes Pixel als echt oder gefälscht bewertet wird, erreichte HDBK hohe Gesamtgenauigkeit und eine starke Überlappung mit den Ground-Truth-Masken bei sehr niedrigen False-Alarm-Raten. Selbst unter schweren Bedingungen wie starker Unschärfe, Rauschen und Kompression blieb die Leistung robust und zeigte sowohl Lage als auch Form der verfälschten Regionen auf.

Was das für das alltägliche Vertrauen in Fotos bedeutet

Vereinfacht gesagt bietet diese Forschung einen intelligenteren Detektiv für digitale Bilder. Indem zunächst tiefe Netzwerke grob Bereiche markieren, die ungewöhnlich erscheinen, und anschließend optimierte Blocksuche sowie Keypoint-Matching einsetzen, um genau zu verfolgen, was kopiert wurde und woher es stammt, kann HDBK versteckte Bearbeitungen zuverlässig aufdecken, die juristische Entscheidungen, Nachrichtenberichte oder medizinische Diagnosen beeinflussen könnten. Sehr kleine oder strukturlose Fälschungen bleiben zwar eine Herausforderung, und es ist weitere Arbeit nötig, um die Methode über Copy–Move hinaus auf andere Manipulationsarten auszuweiten, doch dieser hybride Ansatz ist ein wichtiger Schritt zur Wiederherstellung des Vertrauens in das, was wir auf Bildschirmen sehen.

Zitation: Mehrjardi, F.Z., Zarchi, M.S. A hybrid model for image forgery detection using deep learning with block and keypoint methods. Sci Rep 16, 11169 (2026). https://doi.org/10.1038/s41598-026-41473-8

Schlüsselwörter: Erkennung von Bildfälschungen, Copy-Move-Manipulation, Deep Learning, digitale Forensik, Bildauthentizität