Clear Sky Science · es
Conjunto de datos integral basado en smartphone de imágenes anotadas de la cavidad oral para mejorar el diagnóstico de enfermedades bucales
Por qué tu teléfono podría ayudar a detectar el cáncer de boca
La mayoría llevamos en el bolsillo una cámara potente, pero rara vez se usa para buscar señales tempranas de enfermedad en el interior de la boca. El cáncer oral y sus signos de aviso suelen pasar desapercibidos hasta estadios avanzados, sobre todo en comunidades con pocos especialistas. Este estudio describe SMART‑OM, una colección cuidadosamente curada de fotografías del interior de la boca, tomadas con smartphones corrientes y etiquetadas meticulosamente por expertos dentales. El objetivo es proporcionar a los investigadores el material bruto necesario para crear herramientas de inteligencia artificial que puedan señalar cambios preocupantes mucho antes de que resulten mortales.

El problema global dentro de la boca
Los cánceres de labios y cavidad oral causan la muerte de casi doscientos mil personas en todo el mundo cada año, con cientos de miles de casos nuevos, y la carga es especialmente elevada en países de ingresos bajos y medios. El tabaco, el alcohol y el consumo de nuez de areca son factores de riesgo importantes, y hombres y personas mayores se ven particularmente afectados. El diagnóstico temprano mejora mucho la supervivencia, pero en muchas regiones es difícil acceder a un especialista, y las revisiones bucales rutinarias dependen del ojo y la experiencia del dentista. Eso hace que parches sutiles o zonas rugosas puedan pasar desapercibidos, o que distintos clínicos discrepen sobre lo observado. Una forma de bajo coste y ampliamente disponible para registrar y revisar el interior de la boca podría marcar una diferencia real.
Convertir los smartphones en herramientas de cribado
El proyecto SMART‑OM se planteó capturar imágenes de alta calidad de la cavidad oral en contextos comunitarios reales usando solo dos smartphones comunes, uno Android y un iPhone. Agentes de salud comunitarios y dentistas en el sur de India visitaron hogares y campamentos dentales, reclutando a adultos que aceptaron ser examinados. Para cada participante se fotografiaron ocho vistas estándar, que cubrían la lengua, las mejillas, los labios y los arcos dentales superior e inferior. Se procuró usar sobre todo luz natural, situar la cámara a solo unos centímetros y emplear herramientas sencillas como espejos bucales o palillos de madera para separar suavemente mejillas y labios. Las tomas borrosas o mal iluminadas se repetían, y toda la recogida de datos siguió normas éticas estrictas, manteniendo los rostros fuera de plano y anonimando por completo los datos personales.
De imágenes en bruto a datos ricos y etiquetados
En total, el equipo reunió 2.469 imágenes de 331 personas. Cada foto se clasificó en uno de cuatro grupos: tejido completamente sano; variaciones inofensivas respecto al aspecto habitual; trastornos potencialmente malignos que pueden derivar en cáncer; y cáncer oral confirmado. Cirujanos dentales expertos fueron más allá de las etiquetas simples trazando contornos detallados en las imágenes con una herramienta de anotación de código abierto. Algunas versiones marcan solo la región principal de interés, otras mapean cada estructura visible, y versiones centradas en lesiones trazan parches y crecimientos sospechosos. Junto a las imágenes, el conjunto de datos incluye archivos de hoja de cálculo que enumeran qué representa cada región dibujada y tablas separadas que describen la edad, el sexo, hábitos como fumar o mascar pan masala, y hallazgos clínicos de cada persona. Esta combinación de imágenes y contexto está diseñada para soportar tanto sistemas de IA basados solo en imágenes como multisensoriales.

Poner a prueba modelos de IA
Para mostrar la utilidad de SMART‑OM, los investigadores entrenaron varios modelos de aprendizaje profundo populares, originalmente desarrollados para reconocimiento de imágenes general, para abordar dos tareas: distinguir imágenes normales de anormales y discriminar entre los cuatro grupos diagnósticos. Dividieron el conjunto de datos en porciones de entrenamiento y prueba y ajustaron modelos como ResNet, VGG, EfficientNet y un Vision Transformer. A pesar de que los datos estaban dominados por imágenes sanas y contenían relativamente pocos casos de cáncer y alto riesgo, el mejor modelo, una variante ResNet relativamente compacta, clasificó correctamente cerca de nueve de cada diez imágenes de prueba en conjunto. Fue especialmente fiable reconociendo bocas sanas y razonablemente bueno —aunque menos consistente— señalando las anormales, reflejando el desequilibrio natural y las sutiles diferencias visuales entre categorías.
Qué supone esto para la atención cotidiana
Para los no especialistas, el mensaje clave es que SMART‑OM sienta las bases para convertir un smartphone cotidiano en una ayuda para el cribado precoz del cáncer oral. Al hacer público este conjunto de datos grande, cuidadosamente anotado y totalmente anonimizado, los autores ofrecen a investigadores de todo el mundo un recurso compartido para entrenar y comparar herramientas de IA que puedan resaltar regiones sospechosas, combinar señales de imagen con datos de estilo de vida y ayudar a decidir quién necesita una exploración más profunda por parte de un dentista o un patólogo. Aunque la colección actual todavía contiene relativamente pocos casos verdaderos de cáncer, refleja de cerca lo que se observa en las comunidades y crecerá con el tiempo. A medida que se expanda, SMART‑OM está llamado a respaldar controles más precisos, accesibles y asequibles de cambios peligrosos en la boca, con el potencial de salvar vidas mediante un diagnóstico más temprano.
Cita: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5
Palabras clave: cáncer oral, imágenes con smartphone, IA médica, lesiones bucales, conjunto de datos para cribado