Clear Sky Science · es
Un modelo híbrido para la detección de falsificaciones de imágenes mediante aprendizaje profundo con métodos de bloques y puntos clave
Por qué importan los cambios ocultos en las fotos
Las fotos moldean lo que creemos del mundo, desde noticias y política hasta pruebas médicas y decisiones judiciales. Sin embargo, las herramientas de edición modernas pueden alterar una imagen de forma tan convincente que incluso ojos entrenados pueden no detectarlo. Este artículo presenta un nuevo método, llamado HDBK, que detecta un tipo común de engaño conocido como falsificación copia–movimiento —donde se copia una parte de la imagen y se pega en otra zona de la misma imagen para ocultar o duplicar objetos. El objetivo es ofrecer a los investigadores una herramienta que sea a la vez precisa y lo suficientemente rápida como para ser útil en el trabajo forense real.

Un problema creciente de confianza en las fotos digitales
Cada año se toman y comparten miles de millones de fotos en teléfonos, redes sociales y sistemas profesionales. Al mismo tiempo, las aplicaciones de edición fáciles de usar permiten que casi cualquiera elimine personas de una escena, clone objetos o cambie sutilmente detalles importantes. En la falsificación copia–movimiento, una persona sospechosa puede cubrir pruebas copiando un parche limpio de carretera sobre marcas de frenado, o duplicar una multitud para que un evento parezca más grande. Como esas regiones copiadas proceden de la misma imagen, coinciden naturalmente en iluminación, color y textura, lo que las hace especialmente difíciles de detectar a simple vista o con verificaciones de software sencillas.
Herramientas antiguas y sus puntos débiles
Los métodos de detección existentes buscan pistas de distintas maneras. Los métodos basados en bloques dividen la imagen en numerosos parches pequeños y los comparan para encontrar regiones sospechosamente similares. Esto puede funcionar, pero comprobar cada par posible de parches es lento y falla cuando los falsificadores rotan o redimensionan las partes copiadas, o cuando la imagen se desenfoca o se comprime después. Los métodos basados en puntos clave, en cambio, buscan puntos distintivos —como esquinas o zonas con textura— y los comparan, lo que es más rápido y tolerante a cambios geométricos. Sin embargo, suelen fallar en áreas lisas o muy pequeñas que contienen pocos puntos distintivos. El aprendizaje profundo, donde las redes neuronales aprenden sus propias características a partir de datos, puede detectar falsificaciones a nivel de imagen y de píxel, pero normalmente exige conjuntos de datos grandes y etiquetados con cuidado, que son costosos de crear en trabajos forenses.
Una estrategia híbrida en tres pasos
Los autores proponen HDBK, un sistema híbrido que combina las fortalezas del aprendizaje profundo, el análisis por bloques y la coincidencia de puntos clave, reduciendo a la vez sus debilidades individuales. En el primer paso, tres redes neuronales bien conocidas —VGG16, MobileNet y EfficientNetB0— se combinan en un único modelo de triple rama. Entrenado sobre un banco de pruebas de imágenes auténticas y falsificadas, este conjunto decide rápidamente si una imagen probablemente ha sido manipulada y genera un mapa de calor: una superposición de color que resalta las regiones que la red considera sospechosas. En lugar de apoyarse en máscaras dibujadas a mano durante el entrenamiento, el sistema aprende solo a partir de etiquetas a nivel de imagen y luego usa mapas de características internos para localizar las áreas probablemente alteradas.

Acercarse para precisar la falsificación
Una vez que el mapa de calor aísla una región sospechosa, HDBK estrecha la búsqueda. Se selecciona un bloque alrededor de la zona probablemente falsificada, se extrae de la imagen y se lanza una búsqueda por bloques más inteligente para encontrar de dónde se copió ese contenido. En lugar de comparar exhaustivamente todos los bloques posibles, el método utiliza un algoritmo genético —una técnica de optimización inspirada en la evolución— para explorar solo las posiciones y tamaños de bloque más prometedores. La calidad de cada candidato se mide por el número de puntos característicos coincidentes que comparte con el bloque sospechoso, empleando en combinación tres detectores de puntos clave (SIFT, SURF y FAST). Tras encontrar la mejor coincidencia, el sistema enlaza los puntos clave correspondientes y dibuja un polígono ajustado alrededor de las regiones origen y pegada, refinando las formas con filtros morfológicos para producir una máscara binaria limpia del área manipulada.
Qué tan bien funciona el método
Para evaluar HDBK, los autores usaron el conjunto de datos CoMoFoD, una colección ampliamente empleada de falsificaciones copia–movimiento que incluye casos desafiantes: áreas copiadas pequeñas y lisas, rotaciones, escalados, desenfoque, ruido añadido, cambios de brillo y compresión JPEG agresiva. A nivel de imagen, la red profunda híbrida clasificó correctamente imágenes falsificadas frente a auténticas con aproximadamente un 99 % de precisión, superando a varios modelos modernos. A nivel de píxel, donde cada píxel se juzga como genuino o falsificado, HDBK alcanzó alta precisión global y una fuerte superposición con las máscaras de referencia, manteniendo además las falsas alarmas muy bajas. Incluso en condiciones duras como desenfoque intenso, ruido y compresión, el sistema mantuvo un rendimiento robusto, revelando tanto la ubicación como la forma de las regiones falsificadas.
Qué significa esto para la confianza en las fotos cotidianas
En términos simples, esta investigación ofrece un detective más inteligente para las imágenes digitales. Al usar primero redes profundas para destacar de forma aproximada dónde algo parece estar mal, y luego emplear una búsqueda optimizada por bloques y la coincidencia de puntos clave para rastrear exactamente qué se copió y de dónde provino, HDBK puede descubrir de forma fiable ediciones ocultas que podrían influir en juicios legales, noticias o diagnósticos médicos. Aunque las falsificaciones extremadamente pequeñas o sin textura siguen siendo un reto, y se necesita más trabajo para extender el método más allá de copia–movimiento a otros tipos de manipulación, este enfoque híbrido representa un paso importante para restaurar la confianza en lo que vemos en nuestras pantallas.
Cita: Mehrjardi, F.Z., Zarchi, M.S. A hybrid model for image forgery detection using deep learning with block and keypoint methods. Sci Rep 16, 11169 (2026). https://doi.org/10.1038/s41598-026-41473-8
Palabras clave: detección de falsificación de imágenes, manipulación copia-movimiento, aprendizaje profundo, informática forense digital, autenticidad de imágenes