Clear Sky Science · de

Identifikation mehrerer Augenerkrankungen mittels eines hybriden Quanten‑Convolutional Neural Network mit Fundusbildern

2026-01-31 · Zurück zur Übersicht

Scharfere Augen‑Checks mit intelligenteren Maschinen

Viele der weltweit auftretenden Sehprobleme könnten verhindert werden, wenn Augenerkrankungen früh erkannt würden. Doch Spezialisten und hochwertige Bildgebung sind nicht immer verfügbar. Diese Studie untersucht eine neue Methode zur Auswertung von Fotografien des Augenhintergrunds, sogenannter Fundusbilder, unter Verwendung einer Mischung aus fortschrittlichen Quantenrechnungsansätzen und moderner künstlicher Intelligenz. Das Ziel ist einfach, aber wirkungsvoll: mehrere verbreitete Augenerkrankungen gleichzeitig, schnell und verlässlich zu erkennen, damit erhaltende Behandlungen früher beginnen können.

Warum der Augenhintergrund wichtig ist

Die Netzhaut ist eine dünne Gewebeschicht im hinteren Teil des Auges, die Licht in Signale für das Gehirn umwandelt. Viele schwere Augenleiden hinterlassen an dieser Stelle deutliche Spuren, darunter altersbedingte Makuladegeneration, Glaukom, diabetische Retinopathie, durch Bluthochdruck verursachte Schäden, Myopie und Katarakte. Ärzte können die Netzhaut mit einer Standard‑Funduskamera fotografieren, die günstiger und weiter verbreitet ist als anspruchsvolle Scanner. Das Lesen dieser Bilder per Augenprüfung ist jedoch zeitaufwendig, erfordert hochqualifizierte Expertinnen und Experten und wird besonders schwierig, wenn frühe Krankheitsveränderungen schwach ausgeprägt sind oder mehrere Probleme gleichzeitig bestehen.

Das Bild säubern, bevor diagnostiziert wird

Bevor ein Computer Fundusfotos sinnvoll auswerten kann, müssen die Bilder bereinigt und standardisiert werden. In dieser Arbeit schneiden die Autorinnen und Autoren zunächst die kreisförmige Augenregion aus, skalieren sie und verbessern dann die Sichtbarkeit wichtiger Strukturen mit zwei Techniken: anisotroper Diffusionsfilterung, um Rauschen zu reduzieren ohne die wichtigen Kanten zu verwischen, und Wavelet‑Transformationen zur Kontrastverstärkung. Außerdem vergrößern sie den Trainingssatz durch Drehen, Zoomen, Verschieben und Spiegeln der Bilder sowie durch kontrolliertes Hinzufügen von Rauschen. Dieses sorgfältige „Bild‑Grooming“ hilft dem Modell, die Variationen realer Aufnahmen zu lernen und verringert das Risiko, dass es bei leicht unterschiedlichen Kameras oder Lichtverhältnissen versagt.

Klassische KI mit Quantenideen mischen

Kern der Studie ist ein hybrides Quanten‑Convolutional Neural Network, kurz QCNN. Ein traditionelles Convolutional Neural Network ist sehr gut darin, Muster wie Linien, Texturen und Formen in Bildern zu erkennen. Der QCNN behält diese vertraute Struktur bei, ergänzt sie aber um quanteninspirierte Schichten, die auf als Quantenzustände codierte Daten wirken. Praktisch komprimiert zunächst ein leichtgewichtiges klassisches Netzwerk jeweils ein Paar von Bildern des linken und rechten Auges eines Patienten. Diese Merkmale werden dann in eine acht‑"Qubit"‑Darstellung überführt, in der spezielle Quantengatter Rotationen ausführen und Verbindungen zwischen Qubits aufbauen. So kann das System einen sehr reichen Raum möglicher Muster mit vergleichsweise wenigen einstellbaren Parametern erkunden.

Wie die Quanten‑Schichten lernen

Die Quantenseite des Modells spiegelt wohlbekannte Schritte der Bildanalyse wider. Quanten‑"Konvolutions"‑Schichten wirken wie Filter und scannen die Daten nach nützlichen Strukturen, während Quanten‑"Pooling"‑Schichten die Komplexität reduzieren, indem sie Informationen mehrerer Qubits zusammenführen, ohne die wichtigsten Hinweise zu verlieren. Das System misst wiederholt die resultierenden Quantenzustände und speist diese Messwerte in eine abschließende Entscheidungsschicht ein, die die Wahrscheinlichkeit jeder Augenerkrankungs‑Kategorie ausgibt. Während des Trainings justiert ein klassischer Optimierer sowohl die üblichen neuronalen Netzgewichte als auch die Einstellungen der Quantengatter, um die Leistung zu verbessern, gesteuert durch gängige Kennzahlen wie Genauigkeit, Präzision, Sensitivität (Recall) und F1‑Score.

Das Modell auf die Probe stellen

Um zu prüfen, ob dieser Ansatz mehr ist als eine elegante Idee, trainierten und testeten die Forschenden ihn auf OIA‑ODIR, einer großen öffentlichen Sammlung von 10.000 Fundusbildern von 5.000 Patienten, die für sieben Augenerkrankungen plus gesunde Augen beschriftet sind. Die Daten wurden so aufgeteilt, dass einige Bilder zum Trainieren, einige zum Feinabstimmen und andere—sowohl von derselben Einrichtung als auch von externen Einrichtungen—zum Testen der Generalisierbarkeit verwendet wurden. Im Vergleich mit mehreren leistungsstarken Deep‑Learning‑Systemen, darunter Fundus‑DeepNet, Inception‑v4, VGG16 und ResNet‑101, schnitt der QCNN am besten ab. Er erreichte etwa 94 Prozent Genauigkeit und ähnlich hohe Präzision, Sensitivität und F1‑Scores für sowohl interne als auch externe Testsets, was bedeutet, dass er nicht nur häufig richtig lag, sondern auch wenige erkrankte Fälle übersah.

Was das für Patientinnen und Patienten bedeutet

Laienhaft zusammengefasst lautet die Botschaft: Intelligenter Softwareeinsatz könnte helfen, das Augenlicht zu schützen, indem groß angelegte Netzhautuntersuchungen schneller, konsistenter und in der Lage werden, mehrere Erkrankungen gleichzeitig zu erkennen. Das hier beschriebene quantenverstärkte Netzwerk läuft bislang noch auf Simulatoren und erfordert leistungsfähige Rechner, es ist also noch nicht für den routinemäßigen klinischen Einsatz bereit. Es trägt außerdem die üblichen Einschränkungen medizinischer KI in sich, etwa ungleich verteilte Daten für seltene Erkrankungen und Unterschiede zwischen Krankenhäusern. Dennoch deutet seine starke Leistung darauf hin, dass die Kombination klassischer und quanteninspirierter Methoden mehr Informationen aus denselben Augenfotos herausholen kann. Mit fortschreitender Reife der Quantenhardware und wachsenden Datensätzen könnten solche Systeme praktikable Werkzeuge zur Unterstützung von Augenärzten weltweit werden, insbesondere an Orten, an denen Spezialisten knapp sind.

Zitation: Alqassab, A.I.M., Luque-Nieto, MÁ. & Mohammed, M.A. Identification of multiple ocular diseases using a hybrid quantum convolutional neural network with fundus images. Sci Rep 16, 6798 (2026). https://doi.org/10.1038/s41598-026-38063-z

Schlüsselwörter: retinale Fundusbildgebung, Erkennung von Augenerkrankungen, Quantenneuronale Netzwerke, Analyse medizinischer Bilder, Künstliche Intelligenz in der Ophthalmologie