Clear Sky Science · de
Aufbau des dermatopathologischen Nachschlagewerks DermpathNet mit einem KI-basierten Workflow
Warum eine neue Hautbild-Bibliothek wichtig ist
Hautkrebserkrankungen und andere Gewebewucherungen werden oft durch die Untersuchung dünner Gewebeschnitte unter dem Mikroskop diagnostiziert — ein Fachgebiet, das als Dermatopathologie bekannt ist. Die Bilder, mit denen Ärztinnen und Ärzte ausgebildet werden und die zur Prüfung von Werkzeugen der künstlichen Intelligenz (KI) dienen, sind jedoch häufig hinter Bezahlschranken oder durch Datenschutzbestimmungen verborgen. Dieses Papier stellt DermpathNet vor, eine frei verfügbare, sorgfältig geprüfte Sammlung von tausenden Hautbiopsiebildern, aufgebaut mithilfe von KI. Sie soll das Lernen, das Abgleichen von Diagnosen und die Entwicklung neuer Computerwerkzeuge für Kliniker und Forschende weltweit einfacher und verlässlicher machen. 
Das Problem verborgener Lehrpräparate
Die meisten Medizinstudierenden und Auszubildenden lernen an Glasobjektträgern oder digitalen Dateien, die von einem einzelnen Krankenhaus kontrolliert werden. Diese Materialien können Patientendaten enthalten oder so lizenziert sein, dass sie nicht weitergegeben werden dürfen. Bestehende Online-Ressourcen erfordern häufig kostenpflichtige Abonnements, bieten nur eine Handvoll Beispielfälle oder werden nicht durchgängig von Expertinnen und Experten begutachtet. Infolgedessen fehlt Studierenden und Klinikern eine breite, vertrauenswürdige, offene Sammlung mikroskopischer Hautbilder, die sowohl häufige als auch seltene Tumoren zeigt. Ohne eine solche Ressource ist es schwierig, Fälle zu vergleichen, die Lehre zu standardisieren oder die Leistungsfähigkeit von Computer-Vision‑Systemen fair zu beurteilen.
Qualitätsbilder in einem Meer von Artikeln finden
Die Autorinnen und Autoren wandten sich an die Open-Access-Sammlung von PubMed Central, eine umfangreiche Bibliothek Volltext-biomedizinischer Artikel, deren Inhalte rechtlich wiederverwendet werden dürfen. Sie begannen mit einem strukturierten Verzeichnis, einem Lexikon, von 12 Gruppen gutartiger und bösartiger Hauttumoren und fast 200 konkreten Diagnosen, das auf Expertenwissen und standardisierten medizinischen Vokabularen beruht. Mit diesem Lexikon durchsuchten sie PubMed Central nach Artikeln, deren Titel oder Abstracts diese Erkrankungen erwähnten, luden die Volltexte herunter und extrahierten alle Abbildungen und Bildunterschriften. Dieser erste Durchlauf ergab mehr als 200.000 Abbildungen aus über 43.000 Artikeln — viel zu viele, und die meisten waren keine mikroskopischen Hautbilder.
Wie KI und Schlüsselwörter zusammenarbeiteten
Um nützliche Bilder von irrelevanten zu trennen, entwickelte das Team ein hybrides Filtersystem. Ein Teil bestand aus einem Deep‑Learning‑Modell, das an einer separaten Sammlung medizinischer Bilder trainiert wurde, um zu entscheiden, ob ein Bild wie ein Pathologie‑Präparat aussieht oder nicht. Der andere Teil durchsuchte die Bildunterschriften nach typischen Formulierungen wie Vergrößerungsangaben oder Färbungsbegriffen, die gewöhnlich mit Mikroskopbildern einhergehen. Bei sehr häufigen Diagnosen wurden nur Bilder behalten, die beide Tests bestanden, um die Reinheit zu verbessern; bei seltenen Diagnosen wurden Bilder akzeptiert, die mindestens einen der Tests bestanden, um knappe Beispiele nicht zu übersehen. Gegenüber einem menschlichen „Goldstandard“ von 651 manuell beschrifteten Bildern zeigte diese hybride Methode starke Leistungen mit einem F‑Score von über 90 %, besser als der alleinige Einsatz von KI oder Schlüsselwörtern. 
Was DermpathNet enthält und wie es genutzt wird
Nach der Verarbeitung ergab der Workflow 7.772 Bilder, die 166 verschiedene Hauttumor‑Diagnosen abdecken. Jedes Bild wurde von dermatopathologisch zertifizierten Fachärztinnen und Fachärzten geprüft und ist mit umfangreichen Metadaten verknüpft, die den Quellartikel, den Erkrankungstyp und standardisierte medizinische Codes beschreiben. Der Datensatz ist so organisiert, dass Nutzerinnen und Nutzer nach Krankheitskategorie, spezifischer Diagnose oder Originalpublikation suchen können, wobei die Lizenzinformationen nachvollziehbar bleiben. Über die Lehre hinaus verwendeten die Autorinnen und Autoren DermpathNet, um die Grenzen eines modernen Vision‑Language‑Modells zu untersuchen: GPT‑4v. Auf die Frage, bestimmte Hauttumoren in diesen anspruchsvollen Bildern in Formaten wie Wahr/Falsch, offenen Antworten und Multiple‑Choice zu identifizieren, schnitt das Modell schlecht ab und erkannte häufig nicht die korrekte Diagnose, selbst wenn eine kurze Auswahl an Optionen gegeben war.
Was das für Ärztinnen, Ärzte und Maschinen bedeutet
Für Nicht‑Fachleute lässt sich DermpathNet als ein hochwertiger, offen geteilter Atlas mikroskopischer Hauttumoren verstehen, der mit einem intelligenten Sortiersystem erstellt wurde, sodass menschliche Expertinnen und Experten sich auf die Abschlußprüfung anstatt auf manuelles Durchsehen konzentrieren können. Es senkt die Hürden für Ausbildung und Vergleich zwischen Institutionen und macht die Schwierigkeit der visuellen Aufgabe deutlich: Selbst ein hochmodernes KI‑System tat sich an diesen Bildern schwer. Die Autorinnen und Autoren folgern, dass KI zwar beim Zusammenstellen solcher Ressourcen helfen kann, die heutigen allgemeinen Modelle jedoch noch nicht bereit sind, die Expertise von Spezialisten in der Dermatopathologie zu ersetzen. Stattdessen bietet DermpathNet eine solide Grundlage für Lehre und für den Aufbau der nächsten Generation spezialisierter medizinischer KI‑Werkzeuge, die wirklich bei der Diagnose von Hautkrankheiten unterstützen können.
Zitation: Xu, Z., Lin, M., Zhou, Y. et al. Establishing dermatopathology encyclopedia DermpathNet with Artificial Intelligence-Based Workflow. Sci Data 13, 368 (2026). https://doi.org/10.1038/s41597-026-06715-4
Schlüsselwörter: Dermatopathologie, Datensatz medizinischer Bilder, künstliche Intelligenz, Hautkrebs, digitale Pathologie