Clear Sky Science · it
Un dataset completo di immagini annotate della cavità orale acquisito con smartphone per migliorare la diagnosi delle malattie orali
Perché il tuo telefono potrebbe aiutare a individuare il cancro orale
La maggior parte di noi porta in tasca una fotocamera potente, eppure raramente la si usa per cercare segnali precoci di malattia all’interno della bocca. Il cancro orale e le sue lesioni precursori spesso passano inosservati fino a stadi avanzati, specialmente nelle comunità con pochi specialisti. Questo studio descrive SMART‑OM, una raccolta accuratamente curata di fotografie della cavità orale, tutte scattate con normali smartphone e meticolosamente etichettate da esperti odontoiatri. L’obiettivo è fornire ai ricercatori il materiale grezzo necessario per sviluppare strumenti di intelligenza artificiale in grado di segnalare cambiamenti preoccupanti molto prima che diventino letali.

Il problema globale dentro la bocca
I tumori delle labbra e della cavità orale causano quasi duecentomila decessi all’anno nel mondo, con centinaia di migliaia di nuovi casi, e il peso della malattia è particolarmente gravoso nei paesi a basso e medio reddito. Tabacco, alcol e il consumo di noce di areca sono fattori di rischio importanti, e uomini e persone anziane risultano particolarmente colpiti. La diagnosi precoce migliora notevolmente la sopravvivenza, ma in molte aree è difficile raggiungere uno specialista e i controlli orali di routine si basano sull’occhio e sull’esperienza del dentista. Ciò significa che macchie sottili o aree ruvide possono essere trascurate, oppure diversi clinici possono discordare nell’interpretazione. Un modo a basso costo e ampiamente disponibile per registrare e rivedere l’interno della bocca potrebbe fare una reale differenza.
Trasformare gli smartphone in strumenti di screening
Il progetto SMART‑OM si è proposto di catturare immagini di alta qualità della cavità orale in contesti comunitari reali usando soltanto due smartphone comuni, un Android e un iPhone. Operatori sanitari di comunità e dentisti nel sud dell’India hanno visitato case e campi dentali, reclutando adulti che hanno accettato l’esame. Per ciascun partecipante sono state fotografate otto viste standard, includendo lingua, guance, labbra e arcate dentarie superiore e inferiore. Si è fatto attenzione a usare per lo più luce naturale, posizionare la fotocamera a pochi centimetri di distanza e impiegare strumenti semplici come specchietti intraorali o bastoncini di legno per tenere delicatamente a lato guance e labbra. Scatti sfocati o male illuminati sono stati ripetuti e tutta la raccolta dati ha seguito rigide norme etiche, mantenendo i volti fuori campo e anonimizzando completamente i dati personali.
Dalle immagini grezze a dati ricchi e annotati
In totale il team ha raccolto 2.469 immagini provenienti da 331 persone. Ogni immagine è stata inserita in uno dei quattro gruppi: tessuto completamente sano; variazioni innocue rispetto all’aspetto usuale; disordini potenzialmente maligni che possono evolvere in cancro; e cancro orale confermato. Chirurghi dentali esperti sono andati oltre le semplici etichette tracciando contorni dettagliati sulle immagini tramite uno strumento open‑source per l’annotazione. Alcune versioni segnano soltanto la principale regione di interesse, altre mappano ogni struttura visibile e versioni focalizzate sulle lesioni tracciano le macchie e le escrescenze sospette. Accanto alle immagini, il dataset include file spreadsheet che elencano cosa rappresenta ciascuna regione disegnata e tabelle separate che descrivono età, sesso, abitudini come fumo o masticazione di betel e reperti clinici di ogni persona. Questa combinazione di immagini e contesto è pensata per supportare sia sistemi di IA basati solo sulle immagini sia sistemi multimodali.

Testare i modelli di IA
Per dimostrare l’utilità di SMART‑OM, i ricercatori hanno addestrato diversi modelli deep‑learning popolari, originariamente sviluppati per il riconoscimento generale delle immagini, per affrontare due compiti: distinguere immagini normali da anormali e discriminare tra i quattro gruppi diagnostici. Hanno suddiviso il dataset in porzioni per addestramento e test e messo a punto modelli come ResNet, VGG, EfficientNet e un Vision Transformer. Nonostante i dati fossero dominati da immagini sane e contenessero relativamente pochi casi di cancro e ad alto rischio, il miglior modello, una variante relativamente compatta di ResNet, ha classificato correttamente quasi nove immagini su dieci nel test complessivo. Si è dimostrato particolarmente affidabile nel riconoscere bocche sane e ragionevolmente efficace — seppur meno consistente — nel segnalare quelle anormali, riflettendo lo squilibrio naturale e le sottili differenze visive tra le categorie.
Cosa significa per la cura quotidiana
Per i non specialisti, il messaggio chiave è che SMART‑OM pone le basi per trasformare uno smartphone di uso quotidiano in un aiuto per lo screening precoce del cancro orale. Rendendo questo ampio dataset accuratamente annotato e completamente anonimizzato pubblicamente disponibile, gli autori forniscono ai ricercatori di tutto il mondo una risorsa condivisa per addestrare e confrontare strumenti di IA che possano evidenziare regioni sospette, combinare segnali visivi con dati sullo stile di vita e aiutare a decidere chi necessita di un esame più approfondito da parte di un dentista o di un patologo. Sebbene la raccolta attuale contenga ancora relativamente pochi casi veri di cancro, rispecchia da vicino ciò che si osserva nelle comunità e crescerà nel tempo. Con l’espansione, SMART‑OM è destinato a supportare controlli più accurati, accessibili e a basso costo per cambiamenti pericolosi della bocca, potenzialmente salvando vite grazie a diagnosi anticipate.
Citazione: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5
Parole chiave: cancro orale, immagini da smartphone, IA medica, lesioni orali, dataset per screening