Clear Sky Science · de

Ein Smartphone‑basiertes umfassendes Datenset annotierter Mundhöhlenbilder zur besseren Diagnose oraler Erkrankungen

· Zurück zur Übersicht

Warum Ihr Telefon helfen könnte, Mundkrebs zu entdecken

Die meisten von uns tragen eine leistungsstarke Kamera in der Tasche, doch selten wird sie genutzt, um frühzeitige Krankheitszeichen im Mund zu suchen. Oraler Krebs und seine Warnzeichen bleiben oft unentdeckt, bis sie fortgeschritten sind, insbesondere in Gemeinden mit wenigen Spezialisten. Diese Studie beschreibt SMART‑OM, eine sorgfältig kuratierte Sammlung von Fotografien der Mundhöhle, alle mit handelsüblichen Smartphones aufgenommen und von Zahnmedizinern präzise beschriftet. Ziel ist es, Forschern das Rohmaterial zur Verfügung zu stellen, das sie benötigen, um KI‑Werkzeuge zu entwickeln, die beunruhigende Veränderungen erkennen, lange bevor sie lebensbedrohlich werden.

Figure 1
Figure 1.

Das weltweite Problem in der Mundhöhle

Krebserkrankungen der Lippen und der Mundhöhle töten weltweit jährlich fast zweihunderttausend Menschen und bringen hunderte von tausend Neuerkrankungen mit sich; die Last ist besonders hoch in Ländern mit niedrigem und mittlerem Einkommen. Tabak, Alkohol und Betelnusskaue sind wesentliche Risikotreiber, und Männer sowie ältere Menschen sind besonders betroffen. Eine frühe Diagnose verbessert die Überlebenschancen erheblich, doch in vielen Regionen ist der Zugang zu Spezialisten schwierig, und routinemäßige Munduntersuchungen beruhen auf dem Blick und der Erfahrung eines Zahnarztes. Das bedeutet, dass subtile Flecken oder raue Stellen übersehen werden können oder verschiedene Behandler unterschiedliche Einschätzungen haben. Eine kostengünstige, weit verbreitete Möglichkeit, das Innere des Mundes zu dokumentieren und zu überprüfen, könnte einen echten Unterschied machen.

Smartphones als Screening‑Werkzeuge nutzen

Das SMART‑OM‑Projekt hatte zum Ziel, hochwertige Bilder der Mundhöhle in realen Gemeinschaftsumgebungen nur mit zwei gängigen Smartphones aufzunehmen, einem Android und einem iPhone. Mitarbeiter des Gesundheitswesens in der Gemeinschaft und Zahnärzte in Südindien besuchten Häuser und Zahnlager und rekrutierten Erwachsene, die einer Untersuchung zustimmten. Von jedem Teilnehmer wurden acht standardisierte Ansichten fotografiert, die Zunge, Wangen, Lippen sowie den oberen und unteren Zahnbogen abdecken. Darauf wurde geachtet, überwiegend natürliches Licht zu verwenden, die Kamera nur wenige Zentimeter entfernt zu positionieren und einfache Hilfsmittel wie Mundspiegel oder Holzstäbchen einzusetzen, um Wange und Lippe sanft zur Seite zu halten. Verschwommene oder schlecht beleuchtete Aufnahmen wurden wiederholt, und die Datenerhebung erfolgte unter strengen ethischen Vorgaben: Gesichter blieben aus dem Bildrahmen und persönliche Angaben wurden vollständig anonymisiert.

Von Rohbildern zu reichhaltigen, beschrifteten Daten

Insgesamt stellte das Team 2.469 Bilder von 331 Personen zusammen. Jedes Bild wurde einer von vier Gruppen zugeordnet: völlig gesundes Gewebe; harmlose Abweichungen vom üblichen Erscheinungsbild; potenziell maligne Erkrankungen, die sich zu Krebs entwickeln können; und bestätigter oraler Krebs. Expertinnen und Experten der Zahnchirurgie gingen über einfache Labels hinaus und zeichneten detaillierte Umrisse auf den Bildern mit einem Open‑Source‑Annotationstool. Manche Versionen markieren nur die Hauptregion von Interesse, andere kartieren jede sichtbare Struktur, und speziell auf Läsionen fokussierte Versionen zeichnen verdächtige Flecken und Wucherungen nach. Ergänzend zu den Bildern enthält das Datenset Tabellenkalkulationsdateien, die auflisten, was jede gezeichnete Region darstellt, sowie separate Tabellen mit Angaben zu Alter, Geschlecht, Gewohnheiten wie Rauchen oder Betelnusskauen und klinischen Befunden jeder Person. Diese Kombination aus visuellen Daten und Kontext ist darauf ausgelegt, sowohl bildbasierte als auch multimodale KI‑Systeme zu unterstützen.

Figure 2
Figure 2.

KI‑Modelle auf die Probe stellen

Um zu zeigen, wie nützlich SMART‑OM sein kann, trainierten die Forschenden mehrere gängige Deep‑Learning‑Modelle, die ursprünglich für allgemeine Bilderkennung entwickelt wurden, für zwei Aufgaben: normale von abnormen Bildern zu unterscheiden und zwischen den vier diagnostischen Gruppen zu differenzieren. Sie teilten das Datenset in Trainings‑ und Testanteile auf und feinjustierten Modelle wie ResNet, VGG, EfficientNet und einen Vision Transformer. Trotz der Dominanz gesunder Bilder und der relativ geringen Zahl an Krebs‑ und Hochrisikofällen klassifizierte das beste Modell, eine relativ kompakte ResNet‑Variante, insgesamt knapp neun von zehn Testbildern korrekt. Besonders zuverlässig war es beim Erkennen gesunder Mundhöhlen und vergleichsweise gut — wenn auch weniger konsistent — beim Aufzeigen abnormer Befunde, was die natürliche Unausgewogenheit und die subtilen visuellen Unterschiede zwischen den Kategorien widerspiegelt.

Was das für die alltägliche Versorgung bedeutet

Für Nicht‑Spezialisten ist die Kernbotschaft, dass SMART‑OM die Grundlage dafür legt, ein alltägliches Smartphone in ein Hilfsmittel für die frühe Erkennung von Mundkrebs zu verwandeln. Indem die Autorinnen und Autoren dieses große, sorgfältig annotierte und vollständig anonymisierte Datenset öffentlich zugänglich machen, stellen sie Forschenden weltweit eine gemeinsame Ressource zur Verfügung, um KI‑Werkzeuge zu trainieren und zu vergleichen, die verdächtige Regionen hervorheben, Bildhinweise mit Lebensstilrisiken verknüpfen und helfen können zu entscheiden, wer eine weitergehende Untersuchung durch einen Zahnarzt oder Pathologen benötigt. Obwohl die gegenwärtige Sammlung noch relativ wenige echte Krebsfälle enthält, spiegelt sie die Verhältnisse in Gemeinschaften gut wider und wird mit der Zeit wachsen. Mit zunehmender Erweiterung kann SMART‑OM genauere, zugänglichere und bezahlbarere Kontrollen gefährlicher Mundveränderungen unterstützen und so möglicherweise Leben durch frühere Diagnosen retten.

Zitation: Madan Kumar, P.D., Ranganathan, K., Lavanya, C. et al. A Smartphone-based Comprehensive Dataset of Annotated Oral Cavity Images for Enhanced Oral Disease Diagnosis. Sci Data 13, 676 (2026). https://doi.org/10.1038/s41597-026-06954-5

Schlüsselwörter: oraler Krebs, Smartphone‑Bildgebung, medizinische KI, orale Läsionen, Screening‑Datensatz