Clear Sky Science · fr
MmodalFire : un ensemble de données multimodal continu comprenant vidéo et capteurs physiques pour la détection d’incendies intérieurs
Pourquoi de meilleurs détecteurs d’incendie sont importants
Dans de grands bureaux, des centres de données ou des immeubles résidentiels, quelques minutes peuvent faire la différence entre un incident limité et un incendie mortel. Les détecteurs de fumée ou de chaleur traditionnels montés au plafond réagissent souvent seulement après que la fumée ait monté ou que la pièce se soit réchauffée, ce qui peut prendre un temps précieux. Pendant ce temps, les caméras de sécurité modernes surveillent en continu les mêmes espaces mais peuvent être trompées par le brouillard, la vapeur ou des reflets lumineux. Cet article présente une nouvelle ressource : un jeu de données conçu avec soin qui combine à la fois la vidéo de caméra et des mesures de capteurs physiques, afin que les systèmes d’intelligence artificielle puissent apprendre à détecter les incendies intérieurs plus rapidement et plus fiablement que chaque méthode prise séparément.
Une nouvelle manière d’envisager les incendies intérieurs
Les auteurs présentent MmodalFire, un jeu de données public créé spécifiquement pour la recherche sur la détection d’incendies intérieurs. Plutôt que de s’appuyer uniquement sur la vidéo ou sur des capteurs autonomes, MmodalFire enregistre les deux simultanément. Chaque expérience capture une vidéo haute définition ainsi que six types de sorties de capteurs, y compris la densité de fumée, la température et le rayonnement dans plusieurs bandes infrarouges et ultraviolettes. Chaque courte séquence est simplement étiquetée « fire » ou « non-fire », ce qui permet aux modèles informatiques d’apprendre à distinguer les événements dangereux des leurres inoffensifs. En rendant ce jeu de données librement disponible, l’équipe vise à fournir aux chercheurs un banc d’essai commun et réaliste pour comparer les algorithmes de détection d’incendie.

Comment les expériences ont été conçues
Pour construire MmodalFire, les chercheurs ont installé des pièces d’essai identiques dans deux laboratoires en Chine. Chaque pièce avait la taille d’un petit bureau, avec des murs fixes, des détecteurs montés au plafond et une caméra dans un coin offrant une vue d’ensemble. Ils ont réalisé des brûlages contrôlés de quatre matériaux d’intérieur courants : bois, corde en coton, mousse de polyuréthane (comme le rembourrage de meubles) et n‑heptane (un liquide à combustion propre similaire à certains carburants). Pour s’assurer que le système puisse aussi apprendre ce qui n’est pas un feu, ils ont créé deux conditions d’interférence : de la fumée théâtrale obtenue avec de la glace carbonique et une brume d’eau produite par un humidificateur domestique. Pendant chaque essai, la caméra et les capteurs fonctionnaient en continu, enregistrant les images vidéo et les mesures numériques avec des horodatages précis.
Capturer la variété du monde réel
Les bâtiments réels diffèrent par l’éclairage, les mouvements d’air et la distance d’un incendie aux détecteurs, aussi l’équipe a volontairement varié ces facteurs. Ils ont ajusté le vent de l’air calme à de douces brises, alterné entre éclairage fort et faible, modifié la quantité de combustible utilisée et déplacé le foyer plus près ou plus loin des capteurs et des murs. Lors de certaines expériences, le feu produisait une fumée noire dense et un échauffement rapide ; lors d’autres, comme avec le n‑heptane, les flammes étaient visibles avec peu de fumée. Pour les cas négatifs, la brume d’eau et la vapeur de glace carbonique ressemblaient beaucoup à de la fumée sur l’image caméra, mais perturbaient à peine les capteurs physiques. Au total, ils ont collecté 65 séquences vidéo — plus de 700 minutes de film — avec des données de capteurs synchronisées, puis les ont découpées en de nombreux clips de cinq secondes se chevauchant, chacun pouvant servir d’exemple d’entraînement unique.

Apprendre aux machines à combiner les sens
À l’aide de MmodalFire, les auteurs ont construit et testé plusieurs modèles informatiques. Certains modèles n’utilisaient que la vidéo, d’autres uniquement les mesures des capteurs, et les plus avancés fusionnaient les deux. La branche vidéo reposait sur un réseau d’apprentissage profond léger, adapté au mouvement et à l’apparence dans de courts clips. La branche capteurs traitait les six flux numériques comme une petite grille évoluant dans le temps et utilisait des techniques modernes comme les transformers pour comprendre leurs motifs. Un module de fusion réunissait ensuite ces deux flux, permettant au modèle de « décider » combien de poids accorder à chaque source selon les conditions. Lors des évaluations sur des données de test séparées, le modèle combiné a clairement surpassé chaque approche monopiste, en particulier dans des situations délicates telles que la fumée n’ayant pas encore atteint les détecteurs au plafond ou une vapeur inoffensive ressemblant à de la fumée à la caméra.
Des alarmes robustes pour des espaces complexes
L’étude conclut que des données vidéo et de capteurs physiques soigneusement synchronisées peuvent rendre les systèmes d’alarme incendie intérieurs à la fois plus rapides et plus fiables. En montrant qu’un modèle fusionné peut continuer à fonctionner même lorsque la caméra est obstruée ou lorsque les capteurs réagissent lentement, ce travail ouvre la voie à des systèmes plus intelligents pour des installations critiques telles que centrales électriques, salles serveurs et bâtiments à forte occupation. MmodalFire fournit aux chercheurs un jeu de données partagé et réaliste sur lequel concevoir et comparer de tels systèmes, ouvrant la porte à des alarmes de nouvelle génération qui utilisent plusieurs « sens » pour reconnaître un danger réel tout en restant silencieuses face à la vapeur quotidienne et à la fumée de scène.
Citation: Jia, Y., Guo, Y., Chen, Y. et al. MmodalFire: A Continuous Multimodal Dataset Comprising Video and Physical Sensing Data for Detecting Indoor Fires. Sci Data 13, 489 (2026). https://doi.org/10.1038/s41597-026-06810-6
Mots-clés: détection d’incendie intérieur, capteurs multimodaux, surveillance vidéo, jeu de données sécurité incendie, alarme apprentissage profond