Clear Sky Science · fr
Un jeu de données complet basé sur un smartphone d’images annotées de la cavité buccale pour améliorer le diagnostic des maladies buccales
Pourquoi votre téléphone pourrait aider à détecter le cancer de la bouche
La plupart d’entre nous ont un appareil photo puissant dans la poche, pourtant il est rarement utilisé pour rechercher les signes précoces de maladie à l’intérieur de la bouche. Le cancer buccal et ses signes avant‑coureurs passent souvent inaperçus jusqu’à un stade avancé, surtout dans les communautés où les spécialistes sont rares. Cette étude décrit SMART‑OM, une collection soigneusement organisée de photographies de l’intérieur de la bouche, toutes prises avec des smartphones ordinaires et minutieusement étiquetées par des experts dentaires. L’objectif est de fournir aux chercheurs la matière première nécessaire pour développer des outils d’intelligence artificielle capables de signaler des changements préoccupants bien avant qu’ils ne deviennent mortels.

Le problème mondial au fond de la bouche
Les cancers des lèvres et de la cavité buccale font près de deux cent mille morts dans le monde chaque année, avec des centaines de milliers de nouveaux cas, et le fardeau est particulièrement lourd dans les pays à revenu faible ou intermédiaire. Le tabac, l’alcool et la mastication de l’aréca sont des facteurs de risque majeurs, et les hommes et les personnes âgées sont particulièrement touchés. Un diagnostic précoce améliore fortement la survie, mais dans de nombreuses régions il est difficile d’accéder à un spécialiste, et les contrôles buccaux de routine reposent sur l’oeil et l’expérience du dentiste. Cela signifie que des taches subtiles ou des zones rugueuses peuvent être manquées, ou que différents cliniciens puissent différer dans leur interprétation. Une méthode peu coûteuse et largement disponible pour enregistrer et revoir l’intérieur de la bouche pourrait faire une vraie différence.
Transformer les smartphones en outils de dépistage
Le projet SMART‑OM s’est donné pour objectif de capturer des images de haute qualité de la cavité buccale en conditions réelles communautaires en utilisant seulement deux smartphones courants, un Android et un iPhone. Des agents de santé communautaire et des dentistes du sud de l’Inde ont rendu visite à des foyers et organisé des camps dentaires, recrutant des adultes ayant accepté d’être examinés. Pour chaque participant, huit vues standard ont été photographiées, couvrant la langue, les joues, les lèvres et les arcades dentaires supérieures et inférieures. On a veillé à utiliser principalement la lumière naturelle, à positionner l’appareil à quelques centimètres seulement et à employer des outils simples comme des miroirs buccaux ou des bâtonnets en bois pour écarter délicatement les joues et les lèvres. Les clichés flous ou mal éclairés ont été refaits, et toute la collecte de données a respecté des règles éthiques strictes, le visage étant maintenu hors champ et les informations personnelles entièrement anonymisées.
Des images brutes à des données riches et étiquetées
Au total, l’équipe a rassemblé 2 469 images provenant de 331 personnes. Chaque image a été classée dans l’un des quatre groupes suivants : tissu complètement sain ; variations bénignes de l’aspect habituel ; troubles potentiellement malins susceptibles d’évoluer en cancer ; et cancer buccal confirmé. Des chirurgiens-dentistes experts sont ensuite allés au‑delà de simples étiquettes en traçant des contours détaillés sur les images à l’aide d’un outil d’annotation open source. Certaines versions ne marquent que la région d’intérêt principale, d’autres cartographient chaque structure visible, et des versions centrées sur les lésions tracent les taches et excroissances suspectes. Outre les images, le jeu de données comprend des fichiers tableur listant ce que représente chaque région dessinée et des tables séparées décrivant l’âge et le sexe de chaque personne, des habitudes comme le tabagisme ou la mastication de bétel, et les constatations cliniques. Cette combinaison de visuels et de contexte est conçue pour soutenir à la fois des systèmes d’IA basés uniquement sur l’image et des systèmes multimodaux.

Mettre les modèles d’IA à l’épreuve
Pour démontrer l’utilité de SMART‑OM, les chercheurs ont entraîné plusieurs modèles de deep learning populaires, initialement développés pour la reconnaissance d’images générales, afin d’aborder deux tâches : distinguer simplement les images normales des anormales, et différencier les quatre groupes diagnostiques. Ils ont scindé le jeu de données en parties d’entraînement et de test et ont affiné des modèles tels que ResNet, VGG, EfficientNet et un Vision Transformer. Malgré la dominance des images saines et le nombre relativement faible de cas de cancer et de haut risque, le meilleur modèle, une variante ResNet relativement compacte, a correctement classé près de neuf images sur dix dans l’ensemble des images de test. Il s’est montré particulièrement fiable pour reconnaître des bouches saines, et raisonnablement performant — quoique moins constant — pour signaler les cas anormaux, ce qui reflète le déséquilibre naturel et les différences visuelles subtiles entre les catégories.
Ce que cela signifie pour les soins quotidiens
Pour les non‑spécialistes, le message clé est que SMART‑OM jette les bases pour transformer un smartphone ordinaire en outil d’aide au dépistage précoce du cancer buccal. En rendant ce jeu de données volumineux, soigneusement annoté et entièrement anonymisé accessible au public, les auteurs offrent aux chercheurs du monde entier une ressource commune pour entraîner et comparer des outils d’IA capables de mettre en évidence des régions suspectes, de combiner les indices visuels avec des données sur les facteurs de risque liés au mode de vie, et d’aider à décider qui doit être évalué plus en profondeur par un dentiste ou un pathologiste. Bien que la collection actuelle contienne encore relativement peu de cas de cancer avéré, elle reflète fidèlement ce que l’on observe dans les communautés et s’enrichira avec le temps. À mesure de son expansion, SMART‑OM est en mesure de soutenir des contrôles plus précis, accessibles et abordables des modifications buccales dangereuses, pouvant potentiellement sauver des vies grâce à un diagnostic plus précoce.
Citation: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5
Mots-clés: cancer buccal, imagerie par smartphone, IA médicale, lésions buccales, jeu de données de dépistage