Clear Sky Science · es

MmodalFire: un conjunto de datos multimodal continuo que comprende vídeo y datos de sensores físicos para detectar incendios en interiores

· Volver al índice

Por qué importan mejores alarmas contra incendios

En oficinas grandes, centros de datos o edificios de apartamentos, unos pocos minutos pueden marcar la diferencia entre un incidente menor y un incendio mortal. Los detectores tradicionales de humo o temperatura montados en el techo a menudo reaccionan solo después de que el humo haya subido o la sala se haya calentado, lo que puede consumir tiempo precioso. Mientras tanto, las cámaras de seguridad modernas vigilan los mismos espacios de forma continua, pero pueden confundirse por niebla, vapor o reflejos intensos. Este artículo presenta un nuevo tipo de recurso: un conjunto de datos diseñado cuidadosamente que combina vídeo de cámara y lecturas de sensores físicos, para que los sistemas de inteligencia artificial aprendan a detectar incendios en interiores con mayor rapidez y fiabilidad que cada método por separado.

Una nueva forma de observar incendios en interiores

Los autores presentan MmodalFire, un conjunto de datos público creado específicamente para la investigación en detección de incendios en interiores. En lugar de confiar solo en vídeo o en sensores aislados, MmodalFire registra ambos simultáneamente. Cada experimento captura vídeo en alta definición junto con seis tipos de salidas de sensores, incluyendo densidad de humo, temperatura y radiación en varias bandas de infrarrojo y ultravioleta. Cada secuencia corta está etiquetada simplemente como “fuego” o “no fuego”, lo que permite a los modelos informáticos aprender a distinguir eventos peligrosos de sus imitaciones inofensivas. Al poner este conjunto de datos a disposición de forma gratuita, el equipo pretende ofrecer a los investigadores un banco de pruebas común y realista para comparar algoritmos de detección de incendios.

Figure 1
Figura 1.

Cómo se construyeron los experimentos

Para construir MmodalFire, los investigadores montaron habitaciones de prueba idénticas en dos laboratorios en China. Cada habitación tenía aproximadamente el tamaño de una oficina pequeña, con paredes fijas, detectores montados en el techo y una cámara en una esquina para una vista completa. Llevaron a cabo combustiones controladas de cuatro materiales comunes en interiores: madera, cuerda de algodón, espuma de poliuretano (como el relleno de muebles) y n‑heptano (un líquido de combustión limpia similar a algunos combustibles). Para asegurarse de que el sistema también pudiera aprender lo que no es un incendio, crearon dos condiciones de interferencia: humo teatral hecho con hielo seco y niebla de agua procedente de un humidificador doméstico. Durante cada ensayo, la cámara y los sensores funcionaron de forma continua, registrando fotogramas de vídeo y lecturas numéricas con marcas temporales precisas.

Capturando la variedad del mundo real

Los edificios reales difieren en iluminación, movimiento del aire y en la proximidad con la que un incendio puede hallarse respecto a cada detector, por lo que el equipo varió deliberadamente estos factores. Ajustaron el viento desde aire en calma hasta suaves brisas, alternaron entre iluminación brillante y tenue, cambiaron la cantidad de combustible utilizada y acercaron o alejaron el fuego de los sensores y las paredes. En algunas pruebas el fuego produjo humo negro denso y calentamiento rápido; en otras, como con n‑heptano, las llamas eran claras con poco humo. En los casos negativos, la niebla de agua y el vapor de hielo seco se parecían mucho al humo en la imagen de la cámara, pero apenas perturbaban los sensores físicos. En total recopilaron 65 secuencias de vídeo—más de 700 minutos de metraje—con datos de sensores sincronizados, y luego las cortaron en numerosos clips superpuestos de cinco segundos que podían utilizarse como ejemplos individuales de entrenamiento.

Figure 2
Figura 2.

Enseñar a las máquinas a combinar sentidos

Usando MmodalFire, los autores construyeron y probaron varios modelos informáticos. Algunos modelos usaron solo vídeo, otros solo las lecturas de los sensores, y los más avanzados fusionaron ambos. La rama de vídeo se basó en una red ligera de aprendizaje profundo adaptada al movimiento y la apariencia en clips cortos. La rama de sensores trató las seis corrientes numéricas como una pequeña cuadrícula que cambia con el tiempo y empleó técnicas modernas como transformadores para comprender sus patrones. Un módulo de fusión unió después estas dos corrientes, permitiendo que el modelo “decida” cuánto peso dar a cada fuente en distintas condiciones. Al evaluarse con datos de prueba independientes, el modelo combinado superó claramente a cualquier enfoque de fuente única, especialmente en situaciones complicadas como humo que aún no había alcanzado los detectores del techo o vapor inofensivo que en la cámara parecía humo.

Alarmas fiables para espacios complejos

El estudio concluye que datos de vídeo y sensores físicos cuidadosamente sincronizados pueden hacer que las alarmas de incendios en interiores sean tanto más rápidas como más fiables. Al demostrar que un modelo fusionado puede seguir funcionando incluso cuando la cámara está bloqueada o cuando los sensores reaccionan con lentitud, el trabajo apunta hacia sistemas más inteligentes para instalaciones críticas como centrales eléctricas, salas de servidores y edificios de alta ocupación. MmodalFire proporciona a los investigadores un conjunto de datos compartido y realista sobre el que diseñar y comparar tales sistemas, abriendo la puerta a alarmas de nueva generación que usen múltiples “sentidos” para reconocer el peligro real mientras permanecen silenciosas ante el vapor cotidiano y el humo de escena.

Cita: Jia, Y., Guo, Y., Chen, Y. et al. MmodalFire: A Continuous Multimodal Dataset Comprising Video and Physical Sensing Data for Detecting Indoor Fires. Sci Data 13, 489 (2026). https://doi.org/10.1038/s41597-026-06810-6

Palabras clave: detección de incendios en interiores, sensores multimodales, vigilancia por vídeo, conjunto de datos de seguridad contra incendios, alarmas mediante aprendizaje profundo