Clear Sky Science · de

DermaGPT: ein föderiertes multimodales Framework mit einer meta-gelernten Vertrauensfunktion für interpretierbare dermatologische Diagnostik

2026-02-07 · Zurück zur Übersicht

Warum intelligentere Hautkontrollen wichtig sind

Hautprobleme betreffen Milliarden Menschen, doch in vielen Regionen gibt es wenige oder gar keine Dermatologinnen und Dermatologen. Das bedeutet, dass verdächtige Muttermale oder Hautausschläge fehlinterpretiert oder zu spät behandelt werden können, insbesondere in kleineren Kliniken mit begrenzter Technik. Diese Studie stellt DermaGPT vor, ein künstliches Intelligenzsystem, das Ärzten helfen soll, häufige Hautkrebserkrankungen und andere Läsionen auf Fotos zu erkennen, dabei seine Schlussfolgerungen in verständlicher Sprache erläutert und den Datenschutz der Patientinnen und Patienten wahrt.

Eine neue Art digitaler Hautassistenz

DermaGPT ist als zweiteiliger Assistent konzipiert. Zuerst betrachtet ein visueller Modul Nahaufnahmen der Haut, aufgenommen mit gewöhnlichen Smartphone-Kameras oder Dermatoskopen, und sagt voraus, welche von 11 häufigen Läsionstypen vorliegt und ob sie wahrscheinlich gutartig oder bösartig ist. Zweitens wandelt ein separates Sprachmodul diese Vorhersagen in patientengerechte Erklärungen um und beantwortet Fragen wie: Was ist der Befund, wie ernst könnte er sein und welche Behandlungen werden üblicherweise in Betracht gezogen? Durch die Trennung von „Sehen“ und „Erklären“ wollen die Entwickler den diagnostischen Kern stabil halten, während die Erklärungsseite im Laufe der Zeit verbessert oder ausgetauscht werden kann.

Für den realen Klinikbetrieb entwickelt

Im Gegensatz zu vielen medial beachteten medizinischen KI-Systemen, die nur auf großen, teuren Servern laufen, ist DermaGPT absichtlich leichtgewichtig. Sein visueller Backbone, adaptiert von einem Google Vision–Language-Modell, wurde so feinabgestimmt, dass nur etwa ein Prozent seiner Parameter verändert wird. Das macht ihn schnell und erschwinglich genug, um auf bescheidenen Grafikkarten zu laufen, die in Krankenhäusern häufig verfügbar sind. Die Autoren trainierten das System mit bioptisch gesicherten Bildern aus vier privaten Kliniken und testeten es anschließend an einem unabhängigen öffentlichen Datensatz von Stanford mit 4.452 Bildern. In diesem externen Test erkannte DermaGPT den Läsionstyp in etwa 90 Prozent der Fälle korrekt und unterschied gutartige von bösartigen Läsionen in rund 93 Prozent der Fälle richtig.

Daten lokal halten und jedem Standort vertrauen lernen

Da medizinische Bilder sensibel sind, wird DermaGPT mittels föderiertem Lernen trainiert: Jede Klinik behält ihre Bilder vor Ort und teilt nur Modell-Updates, nicht die Rohbilder. Kliniken unterscheiden sich jedoch hinsichtlich Patientengruppen, Kameraperformance und Hauttönen, was ein gemeinsames Modell weniger zuverlässig machen kann. Um dem zu begegnen, ergänzten die Autoren eine meta-gelernte Vertrauensfunktion, die abschätzt, wie verlässlich die Updates jeder Klinik sind, basierend auf Messgrößen wie Unsicherheit, Kalibrierung und Anzeichen für Datenverschiebung. Während des Trainings erhalten Updates von besser kalibrierten, konsistenteren Standorten höhere Gewichtung, während lautere bzw. unzuverlässigere herabgewichtet werden. Dieses „vertrauensbewusste“ Schema verbesserte sowohl die Genauigkeit als auch die Zuverlässigkeit der Konfidenzwerte des Modells, besonders an der herausforderndsten Klinik mit vielfältigeren Hauttypen.

Diagnosen in Alltagssprache erklären

Für die Erklärungen speist DermaGPT seine Vorhersagen in mehrere große Sprachmodelle ein und vergleicht deren Leistung. Zudem nutzt es ein „fortgeschrittenes Retrieval“-Modul, das kurze Abschnitte aus sorgfältig kuratierten Online-Ressourcen der Dermatologie extrahiert und dem Sprachmodell als Kontext zuführt. Vier Fachdermatologinnen und -dermatologen bewerteten die resultierenden Antworten hinsichtlich Klarheit, Nützlichkeit, faktischer Fundierung und wie wahrscheinlich sie selbst ein solches Werkzeug nutzen würden. Über alle Modelle hinweg machte dieser Retrieval-Schritt die Erklärungen informativer und weniger anfällig für unbegründete Behauptungen. Ein Modell namens DeepSeek-V3 stach hervor: Es lieferte die bestbewerteten Erklärungen bei vergleichsweise effizienter Architektur, die für jede Antwort nur einen Teil ihrer Neuronen aktiviert.

Vorteile, Vorbehalte und Ausblick

Insgesamt zeigt DermaGPT, dass es möglich ist, einen Hautdiagnose-Assistenten zu bauen, der schnell, genau, datenschutzbewusst ist und sich in menschlichen Worten erklären kann. Er ersetzt keine Dermatologinnen und Dermatologen; vielmehr soll er Nicht-Spezialisten beim Triage-Prozess unterstützen, bei der Beratung helfen und fachärztliche Orientierung in Kliniken bringen, denen Spezialisten fehlen. Die Autoren betonen, dass weiterhin Risiken bestehen—etwa selbstsichere Erklärungen, die auf einer falschen zugrunde liegenden Diagnose beruhen—und dass mehr Feldstudien nötig sind. Sie planen, das Spektrum der abgedeckten Erkrankungen zu erweitern, seltene Krankheiten und dunklere Hauttöne besser zu erfassen sowie mehrsprachige und selbstüberwachende Funktionen hinzuzufügen. Werden diese Herausforderungen gemeistert, könnten Systeme wie DermaGPT dazu beitragen, hochwertige Hautversorgung in sehr unterschiedlichen Gesundheitssystemen zugänglicher und konsistenter zu machen.

Zitation: Hashjin, N.M., Amiri, M.H. & Najafabadi, M.K. DermaGPT a federated multimodal framework with a meta learned trust function for interpretable dermatology diagnostics. Sci Rep 16, 7959 (2026). https://doi.org/10.1038/s41598-026-38715-0

Schlüsselwörter: Dermatologie KI, Hautkrebs-Erkennung, föderiertes Lernen, medizinische erklärbare KI, klinische Entscheidungsunterstützung