Clear Sky Science · de

Mehrklassige Klassifikation von Gehirntumoren mithilfe einer ResNet101-Backbone, integriertem Multi-Skalen-Deformierbarem-Attention-Modul und erweiterten Datenaugmentierungen

· Zurück zur Übersicht

Warum das Sortieren von Hirnscans wichtig ist

Wenn Ärztinnen und Ärzte Hirnscans auf Tumore untersuchen, müssen sie nicht nur feststellen, ob ein Tumor vorhanden ist, sondern auch, um welchen Typ es sich handelt. Unterschiedliche Tumorarten erfordern unterschiedliche Behandlungen, können auf Magnetresonanztomographie (MRT) jedoch verblüffend ähnlich aussehen. Diese Studie untersucht einen neuen Ansatz der künstlichen Intelligenz, der viele Arten von Gehirntumoren aus MRT-Aufnahmen mit sehr hoher Genauigkeit einordnen kann und damit Radiologen schneller und konstanter bei lebenswichtigen Entscheidungen unterstützen könnte.

Figure 1. Wie KI Gehirn-MRTs in deutliche Gruppen vieler unterschiedlicher Tumortypen einordnet.
Figure 1. Wie KI Gehirn-MRTs in deutliche Gruppen vieler unterschiedlicher Tumortypen einordnet.

Computern das Lesen von Hirnscans beibringen

Die Forschenden konzentrieren sich auf Mehrklassenklassifikation, das heißt darauf, viele Tumorkategorien gleichzeitig zu unterscheiden, statt nur Tumor versus kein Tumor zu erkennen. Sie verwenden ein Deep-Learning-Modell, das auf ResNet101 aufbaut — einem weit verbreiteten Bild­erkennungsnetz, das bereits allgemeine visuelle Muster aus großen Sammlungen natürlicher Bilder gelernt hat. Das Team passt dieses Netzwerk an Gehirn‑MRTs an und wendet es auf einen öffentlichen Datensatz mit 15 Klassen an, von normalem Hirngewebe bis zu spezifischen Tumoren wie Glioblastom, Meningeom und Medulloblastom. Die Bewältigung so vieler Kategorien bringt die Aufgabe näher an das heran, womit Radiologinnen und Radiologen in der Klinik konfrontiert sind.

Reale Daten säubern und ausbalancieren

Sammlungen medizinischer Bilder enthalten häufig Fallstricke, etwa doppelte Scans desselben Patienten oder große Unterschiede in der Häufigkeit einzelner Tumortypen. Um irreführende Ergebnisse zu vermeiden, durchforsten die Autorinnen und Autoren zunächst den gesamten Datensatz, berechnen für jedes Bild einen digitalen Fingerabdruck und entfernen exakte Duplikate. Anschließend gruppieren sie Bilder nach Patienten‑ID und teilen Patienten — nicht einzelne Bilder — in Trainings-, Validierungs‑ und Testmengen auf, sodass Scans derselben Person nie in mehreren Teilmengen auftauchen. Diese patientenbezogene Trennung trägt dazu bei, dass die berichtete Genauigkeit die Leistung an wirklich unbekannten Individuen widerspiegelt und nicht wiederholte Ansichten desselben Gehirns. Das Team setzt außerdem eine Reihe von Bildtransformationen und eine Technik namens MixUp ein, um seltene Tumortypen beim Training besser zu repräsentieren und das Modell robuster gegenüber Variationen in Orientierung, Helligkeit und Rauschen zu machen.

Figure 2. Wie flexible Multi-Skalen-Attention der KI erlaubt, sich auf wichtige Bereiche in Gehirn-MRTs zu konzentrieren, um Tumortypen zu unterscheiden.
Figure 2. Wie flexible Multi-Skalen-Attention der KI erlaubt, sich auf wichtige Bereiche in Gehirn-MRTs zu konzentrieren, um Tumortypen zu unterscheiden.

Mit flexibler Attention genauer hinschauen

Eine Schlüsselinnovation der Studie ist ein Modul, das die Autorinnen und Autoren als Multi-Skalen-Deformierbares-Attention-Modul bezeichnen. Einfach ausgedrückt betrachtet das Modell die MRT auf verschiedenen Detailebenen, von groben Strukturen des gesamten Gehirns bis hin zu feineren Texturen in Tumornähe. Anstatt jeden Ort starr in einem Gitter abzusuchen, lernt die deformierbare Attention, ihren „Blick“ leicht zu verschieben, um informative Regionen gezielt anzuvisieren. Anschließend wendet sie zwei komplementäre Formen von Attention an: eine, die wichtige Stellen im Bild hervorhebt, und eine andere, die die nützlichsten Feature‑Kanäle im Netzwerk verstärkt. Diese Kombination ermöglicht es dem System, subtile Form‑ und Texturunterschiede besser zu erfassen, die einen Tumortyp vom anderen unterscheiden.

Leistung und Vertrauen prüfen

Nach vielen Trainingszyklen erreicht das Modell eine Validierungsgenauigkeit von etwa 97 Prozent und eine Testgenauigkeit von über 99 Prozent über alle 15 Klassen. Die meisten Tumortypen werden im gehaltenen Testset perfekt klassifiziert; nur in wenigen Kategorien kommt es zu Fehlern, meist bei seltenen und visuell ähnlichen Tumoren. Die Forschenden vergleichen ihre Ergebnisse mit einer früheren Methode, die ebenfalls deformierbare Attention verwendet, und zeigen, dass ihr Ansatz in nahezu allen Bewertungsmaßen gleichauf liegt oder besser abschneidet, trotz der komplexen Klassenmischung. Sie setzen das System zusätzlichen Belastungstests aus, indem sie Rauschen hinzufügen und die Bildauflösung reduzieren, und stellen fest, dass die Genauigkeit selbst bei verschlechterter Scanqualität hoch bleibt — ein wichtiger Aspekt für reale Krankenhausbedingungen.

Sehen, was das Modell sieht

Um Klinikerinnen und Klinikern das Vertrauen in das System zu erleichtern, nutzen die Autorinnen und Autoren Visualisierungstools, die zeigen, worauf das Netzwerk bei einer Entscheidung fokussiert. Heatmaps, erzeugt mit Grad‑CAM, heben Bereiche in der MRT hervor, die die Vorhersage am stärksten beeinflusst haben, und SHAP‑basierte Analysen zeigen, welche gelernten Merkmale das Modell zugunsten der einen oder anderen Diagnose treiben. Diese visuellen Erklärungen verweisen konsequent auf Tumorregionen und deren Grenzen statt auf irrelevanten Hintergrund, was darauf hindeutet, dass die Schlussfolgerungen des Modells mit radiologischer Intuition übereinstimmen. Zwar betont die Studie, dass weitere externe Prüfungen nötig sind, sie demonstriert jedoch, dass eine sorgfältig gestaltete Deep‑Learning‑Pipeline nicht nur viele Gehirntumorarten zuverlässig klassifizieren kann, sondern auch interpretierbare Hinweise darauf liefert, wie diese Entscheidungen zustande kommen.

Was das für Patientinnen und Patienten bedeuten könnte

Im klinischen Alltag würde ein solches System Radiologinnen und Radiologen nicht ersetzen, sondern als Zweitleser fungieren, der wahrscheinliche Tumortypen schnell markiert und auf verdächtige Bereiche im Scan aufmerksam macht. Indem es eine große Bandbreite an Tumoren abdeckt und unter verrauschten oder qualitativ schwächeren Bildern stabil bleibt, zeigt das hier beschriebene Framework, wie KI konsistentere und schnellere Diagnosen unterstützen könnte. Mit zusätzlicher Validierung über Krankenhäuser und Scanner hinweg könnten solche Werkzeuge Teil routinemäßiger Arbeitsabläufe werden und Spezialisten ermöglichen, sich stärker auf die Behandlungsplanung zu konzentrieren, während Computer große Teile der wiederholenden Bildsortierung übernehmen.

Zitation: Reddy, B.S., Jha, R.R., Dasore, A. et al. Multi-class classification of brain tumor using a ResNet101 backbone integrated with multi-scale deformable attention module and advanced data augmentations. Sci Rep 16, 15938 (2026). https://doi.org/10.1038/s41598-026-45675-y

Schlüsselwörter: Gehirntumor MRT, Deep Learning, Medizinische Bildgebungs-KI, Tumorklassifikation, Attention-Netzwerke