Clear Sky Science · de

RDE-DR: robuste tiefe Ensemble‑CNNs zur automatisierten Erkennung der diabetischen Retinopathie aus Fundusbildern

2026-05-17 · Zurück zur Übersicht

Warum Augenuntersuchungen für Menschen mit Diabetes wichtig sind

Die diabetische Retinopathie ist eine Folgeerkrankung von Diabetes, die das lichtempfindliche Gewebe im hinteren Teil des Auges langsam schädigt. Wird sie früh erkannt, lässt sie sich häufig behandeln, bevor Sehverlust eintritt. Das händische Begutachten Tausender Netzhautfotos ist für Fachärzte jedoch zeitaufwändig. Diese Studie untersucht, wie eine sorgfältig gestaltete Mischung aus künstlichen Intelligenz‑Modellen dabei helfen kann, diese Bilder verlässlicher zu sichten, sodass Risikopatienten früher erkannt werden und gesunde Patienten unnötige Nachuntersuchungen vermeiden.

Figure 1. Wie kombinierte KI‑Modelle Augenfotos zuverlässiger auf diabetische Schäden untersuchen.

Nach Warnsignalen in Augenfotos suchen

Die Forschenden konzentrieren sich auf Farbaufnahmen der Netzhaut, bekannt als Fundusbilder, aus einer öffentlichen Sammlung namens APTOS 2019. Diese Bilder zeigen winzige Blutgefäße und Punkte von Blutungen oder Austritten, die auf diabetische Schäden hinweisen. Das Team fasst die ursprünglichen fünf medizinischen Einstufungen zu einer einfacheren Fragestellung zusammen, die für großflächiges Screening zählt: Zeigt dieses Auge irgendeine Form von diabetischer Retinopathie oder nicht? Damit wird die Aufgabe zu einer Ja‑/Nein‑Entscheidung, die ein automatisches System für Tausende von Patienten schnell treffen könnte.

Verborgene Details für Computer besser sichtbar machen

Realweltliche Augenaufnahmen variieren stark in Schärfe, Helligkeit und Farbe, was Computer‑Modelle verwirren kann. Um dieses Problem zu verringern, verwenden die Autorinnen und Autoren eine kontraststeigernde Technik namens CLAHE, die lokale Details aufhellt, ohne Rauschen zu überbetonen. Sie skalieren alle Bilder auf ein standardisiertes kleines Quadrat, normalisieren die Farben und nutzen während des Trainings zufällige Drehungen und Spiegelungen, damit das System sich nicht auf einen einzigen Kamerawinkel oder Beleuchtungszustand einstellt. Der Datensatz wird so aufgeteilt, dass vier Fünftel der Bilder die Modelle trainieren und ein Fünftel zurückgehalten wird, um zu testen, wie gut das System auf neue Fälle generalisiert.

Viele Augen statt eines einzigen Modells

Anstatt sich auf ein einzelnes Deep‑Learning‑Modell zu verlassen, trainiert die Studie vier verbreitete Convolutional‑Neural‑Networks, die ursprünglich an einer großen Sammlung alltäglicher Fotos entwickelt wurden. Diese Modelle, bekannt als VGG16, VGG19, ResNet50 und DenseNet121, werden neu trainiert, um gesunde und erkrankte Netzhäute zu erkennen. Jedes einzelne erzielt bereits sehr gute Leistungen und klassifiziert etwa 98 Prozent der Testbilder korrekt, wobei nur wenige erkrankte Augen übersehen werden. Der zentrale Gedanke der Arbeit ist, ihre Stärken durch mehrere Entscheidungs‑Fusionsschemata zu kombinieren, darunter einfaches Mehrheitsvoting, Durchschnitts‑Konfidenzwerte und anspruchsvollere, von Fuzzy‑Logik inspirierte Regeln.

Figure 2. Wie verbesserte Augenbilder mehrere KI‑Netzwerke durchlaufen, deren zusammengeführte Signale über Krankheit oder Gesundheit entscheiden.

Modellmeinungen mit Bedacht kombinieren

Das Team untersucht systematisch sieben Methoden, die Ausgaben der vier Modelle zu verschmelzen, stets unter derselben Trainingsvorgabe. Sie verfeinern zudem den Schwellenwert, bei dem eine Wahrscheinlichkeit in eine Ja‑/Nein‑Vorhersage umgewandelt wird, anstatt einen festen Mittelwert anzunehmen. Durch das Durchlaufen vieler Schwellenwerte messen sie, wie Genauigkeit, Sensitivität und Präzision miteinander abgewogen werden — ein zentraler Aspekt für Screenings, die sowohl verpasste Erkrankungen als auch übermäßige Fehlalarme vermeiden müssen. Darüber hinaus betrachten sie nicht nur die einfache Genauigkeit, sondern analysieren, wie sicher die Modelle gesunde von erkrankten Bildern trennen, etwa mit Receiver‑Operating‑Characterstics‑Kurven und Wahrscheinlichkeitsdichte‑Darstellungen.

Was die Ergebnisse für zukünftige Augen‑Screenings bedeuten

Insgesamt erhalten die Ensemble‑Methoden gleichbleibende oder leicht verbesserte Ergebnisse gegenüber den bereits starken Einzelmodellen und erreichen rund 98,6 Prozent Genauigkeit sowie eine sehr hohe Trennschärfe zwischen den Klassen. Einfache Schemata wie Mehrheitsvoting oder Mittelung der Konfidenzwerte sind bemerkenswert stabil, während eine der Fuzzy‑Methoden empfindlicher auf Designentscheidungen reagiert und weniger ausgewogene Leistungen zeigt. Für Laien lautet die Hauptbotschaft: Das Kombinieren mehrerer gut trainierter Bildleser, nach sorgfältiger Bildbereinigung und Feinabstimmung der Zusammenführungsregeln, führt zu einem vertrauenswürdigeren automatisierten Assistenten. Ein solches Werkzeug wird Augenärzte nicht ersetzen, könnte ihnen aber helfen, große Mengen an Netzhautfotos schnell zu sortieren und die begrenzte Klinikszeit auf Patienten zu fokussieren, deren Augen frühe Anzeichen von Problemen zeigen.

Zitation: Aiche, I., Brik, Y., Attallah, B. et al. RDE-DR: robust deep ensemble CNNs for automated diabetic retinopathy detection from fundus images. Sci Rep 16, 15226 (2026). https://doi.org/10.1038/s41598-026-48669-y

Schlüsselwörter: diabetische Retinopathie, Fundusbildgebung, Deep Learning, Ensemble‑Modelle, medizinisches Screening