Clear Sky Science · de
Ein zweistufiger Vorverarbeitungs- und Klassifikationsansatz für eine genaue COVID-19-Erkennung in Röntgenaufnahmen
Warum intelligenteres Röntgenlesen wichtig ist
Während der COVID-19-Pandemie verließen sich Ärztinnen und Ärzte hauptsächlich auf Labortests, um Infektionen zu bestätigen. Laborausrüstung kann jedoch knapp sein und Ergebnisse können Zeit brauchen – besonders an Orten mit begrenzten Ressourcen. Thorax-Röntgenaufnahmen sind dagegen schnell und breit verfügbar, doch selbst erfahrene Radiologinnen und Radiologen tun sich oft schwer, die häufig subtilen Lungenveränderungen durch COVID-19 zu erkennen. Diese Arbeit untersucht einen Weg, Computern das Lesen von Röntgenbildern zuverlässiger beizubringen, indem die Bilder zunächst bereinigt und dann moderne künstliche Intelligenz angewendet wird, mit dem Ziel, Kliniker schneller und genauer zu unterstützen.
Wichtige Details in verrauschten Bildern erkennen
Eine Thorax-Röntgenaufnahme enthält ein Durcheinander von Informationen: Knochen, Weichgewebe, Schatten und Geräteartefakte liegen übereinander. Übliche Deep-Learning-Systeme versuchen, direkt aus diesen Rohbildern zu lernen, das heißt, das Netz muss selbst herausfinden, welche Bereiche eines Bildes wichtig sind. Das ist schwierig, wenn Bilder in Helligkeit, Kontrast und Qualität variieren. Die Autoren gehen dieses Problem an, indem sie einen dedizierten Vorverarbeitungsschritt einfügen, bevor die Röntgenbilder das neuronale Netz erreichen. Sie verwenden eine Computer-Vision-Technik namens Maximally Stable Extremal Regions (MSER), die das Bild auf vielen Helligkeitsstufen durchscannt und Regionen auswählt, die stabil bleiben, wenn sich der Schwellenwert ändert. Diese stabilen Bereiche entsprechen oft sinnvollen Strukturen – etwa Bereichen mit abnormalem Lungengewebe – und ignorieren zufälliges Rauschen.

Die Einstellungen von einem virtuellen Wolfsrudel abstimmen lassen
MSER ist leistungsfähig, aber empfindlich: Seine Leistung hängt stark von mehreren numerischen Einstellungen ab, die steuern, wie groß eine Region sein darf, wie sehr ihre Helligkeit variieren kann und wie glatt ihre Ränder erscheinen sollen. Alle Kombinationen manuell an Tausenden von Röntgenaufnahmen zu testen, wäre mühsam und langsam. Zur Lösung setzen die Forschenden ein naturinspiriertes Optimierungsverfahren ein, den Grey Wolf Optimizer. In diesem Algorithmus erkundet ein virtuelles „Rudel“ von Wölfen verschiedene Parameterkombinationen und bewegt sich schrittweise zu denen, die die saubersten und informativsten Regionen in den Bildern erzeugen. Die Qualität jeder Einstellung wird mit einer Messgröße bewertet, die Regionen belohnt, die sowohl intern gleichmäßig als auch klar von ihrer Umgebung getrennt sind. Über einige Dutzend Iterationen pro Bild konvergiert das Rudel zu einem Parametersatz, der verdächtige Lungenbereiche deutlich hervorhebt.
Neuronale Netze mit saubereren Bildern trainieren
Sobald die Röntgenbilder auf diese Weise verfeinert sind, werden sie an ein tiefes konvolutionales neuronales Netz weitergegeben – dieselbe Klasse von Modellen, die weithin für Gesichtserkennung und selbstfahrende Autos verwendet wird. Die Autoren testeten ihre zweistufige Pipeline mit drei verschiedenen Netzwerkfamilien: einem sehr einfachen, eigenen Netz, DenseNet (einer stärkeren und komplexeren Architektur) und MobileNet (einem leichteren Modell für mobile Geräte). Für jede dieser Architekturen verglichen sie die Leistung auf zwei öffentlichen Thorax-Röntgen-Datensätzen, zunächst mit Rohbildern und dann mit Bildern, die durch die MSER–Grey-Wolf-Kombination vorverarbeitet wurden. Über alle Versuche hinweg führten die vorverarbeiteten Bilder zu höherer Genauigkeit, weniger Fehlalarmen und schnellerem Training. In einem Fall stieg die Genauigkeit von etwa 90 % auf nahezu 99 %, während sich die Trainingszeit ungefähr um zwei Drittel verringerte.

Wie robust ist dieser Ansatz in der Praxis?
Um zu prüfen, ob die Methode nur Eigenheiten eines einzelnen Datensatzes auswendig gelernt hatte, führten die Autoren einen härteren Test durch: Sie trainierten ihre Modelle an einer Sammlung von Röntgenaufnahmen und evaluierten sie anschließend an einer anderen, zuvor unbekannten Sammlung. Die Leistung sank erwartungsgemäß, doch die Systeme mit der neuen Vorverarbeitung hielten deutlich besser durch als diejenigen, die nur mit Rohbildern trainiert wurden. Die Studie enthielt außerdem eine Ablationsanalyse, die zeigte, dass die Verwendung von MSER ohne automatische Abstimmung kaum half, sowie einen Vergleich mit einer konventionelleren Kontrastverbesserungsmethode. In diesen Fällen verschwanden die Verbesserungen weitgehend. Das deutet darauf hin, dass der Schlüssel nicht nur im „Verbessern“ der Bilder liegt, sondern darin, den Algorithmus datengetrieben und prinzipiengeleitet zu führen, stabile, krankheitsrelevante Regionen zu isolieren.
Was das für Patientinnen, Patienten und Ärztinnen und Ärzte bedeutet
Die Arbeit ersetzt weder PCR-Tests noch expertische Radiologinnen und Radiologen, und die Autoren weisen auf Einschränkungen hin: Die Daten stammen aus einer begrenzten Krankenhausgruppe, und sie testeten die Methode nicht auf jeder modernen Netzwerkarchitektur oder bei anderen Lungenerkrankungen. Dennoch zeigen ihre Ergebnisse, dass durchdachte Vorverarbeitung bestehende KI-Systeme deutlich genauer und effizienter machen kann. Indem neuronalen Netzen geholfen wird, sich auf die informativsten Bereiche jeder Thorax-Röntgenaufnahme zu konzentrieren, bietet der zweistufige Ansatz einen praxisnahen Weg zu verlässlichen, automatisierten Unterstützungstools zur Diagnose von COVID-19 und potenziell auch anderen Atemwegserkrankungen – besonders in Umgebungen, in denen schnelle Entscheidungen und begrenzte Rechenressourcen zum Alltag gehören.
Zitation: González, A., Gutiérrez, V.G., Cuevas, E. et al. A two-stage preprocessing and classification approach for accurate COVID-19 detection in X-ray images. Sci Rep 16, 13514 (2026). https://doi.org/10.1038/s41598-026-41861-0
Schlüsselwörter: COVID-19 Röntgen-Diagnose, Vorverarbeitung medizinischer Bilder, Tiefes Lernen in der Radiologie, computerunterstützte Erkennung, KI für Brustbildgebung