Clear Sky Science · de

Ein agentisches System zur Diagnostik seltener Erkrankungen mit nachvollziehbarer Entscheidungsfindung

· Zurück zur Übersicht

Warum schnellere Erkennung seltener Krankheiten wichtig ist

Für Familien mit seltenen Erkrankungen kann es Jahre voller Arzttermine, widersprüchlicher Meinungen und Sackgassen dauern, bis die Krankheit einen Namen bekommt. Diese lange „diagnostische Odyssee“ verzögert die Behandlung, zehrt Ersparnisse auf und lässt Patientinnen und Patienten im Ungewissen. In dieser Studie wird DeepRare vorgestellt, ein künstlich‑intelligentes System, das als digitale Unterstützung für Ärztinnen und Ärzte fungieren soll. Es zielt darauf ab, seltene Krankheiten früher zu erkennen und seine Schlussfolgerungen so zu erläutern, dass Clinici dies prüfen und vertrauen können.

Eine neue Art digitaler Assistenz für Ärztinnen und Ärzte

DeepRare ist so konzipiert, dass es im Ablauf realer Kliniken arbeitet. Es kann freie Textdokumente aus der Klinik, strukturierte Symptomlisten und Befunde moderner Gentests lesen und all das in eine gereihte Liste möglicher seltener Erkrankungen überführen. Anders als viele bestehende Werkzeuge, die lediglich Namen zurückliefern, erzeugt DeepRare eine Schritt‑für‑Schritt‑Begründungskette, die jede Empfehlung mit medizinischen Publikationen, Experten‑Datenbanken und ähnlichen früheren Fällen verknüpft. Das ermöglicht der behandelnden Person, nicht nur zu sehen, was das System empfiehlt, sondern auch warum.

Figure 1
Figure 1.

Wie das System einen Fall durchdenkt

Unter der Haube ist DeepRare als „Multi‑Agenten“‑System organisiert. Im Zentrum steht ein leistungsfähiges Sprachmodell, das als Koordinator agiert und entscheidet, wie weiter vorzugehen ist, wenn neue Informationen eintreffen. Daran angrenzend arbeiten spezialisierte Hilfsmodule: Einige bereinigen und standardisieren Symptome, andere durchsuchen medizinische Literatur und Datenbanken zu seltenen Krankheiten, wieder andere werten lange Listen von Genvarianten aus. Für jede Patientin und jeden Patienten durchläuft DeepRare Zyklen des Sammelns von Belegen, Vorschlagens von Diagnosen und anschließendem Überprüfens der eigenen Hypothesen. Findet es Schwächen in einer Kandidatenerklärung, geht es zurück, um bessere Belege zu suchen, anstatt mit einer wackeligen Vermutung fortzufahren.

DeepRare in der Praxis getestet

Die Forschenden prüften DeepRare an 6.401 Patientenfällen aus neun verschiedenen Quellen, darunter große öffentliche Datensätze, Online‑Fallberichte und vier große Krankenhäuser in Europa, Nordamerika und China. Zusammen deckten diese Fälle 2.919 verschiedene seltene Erkrankungen in 14 Organsystemen ab, von Hirnerkrankungen bis zu Nierenerkrankungen. Verwendete man nur strukturierte Symptomangaben, platzierte DeepRare die tatsächliche Erkrankung bei etwa 57 % der Fälle an erster Stelle — mehr als 20 Prozentpunkte besser als die nächstbeste Methode und deutlich vor weit verbreiteten Werkzeugen wie PhenoBrain und PubCaseFinder. Wenn zusätzlich Genomsequenz‑Ergebnisse vorlagen, stieg die Genauigkeit auf Platz 1 auf etwa 69 %, wobei DeepRare in zwei unabhängigen Krankenhauskohorten ein führendes Genetiktool namens Exomiser übertraf.

Vergleich von KI und menschlichen Spezialistinnen und Spezialisten

Um zu prüfen, ob DeepRares Leistung mit menschlichen Expertinnen und Experten mithalten kann, führten die Autorinnen und Autoren einen Direktvergleich mit 163 schwierigen Fällen aus einer Kinderklinik durch. Fünf Ärztinnen und Ärzte mit mehr als zehn Jahren Erfahrung in seltenen Erkrankungen wurden gebeten, pro Fall bis zu fünf mögliche Diagnosen vorzuschlagen, wobei sie Suchmaschinen, aber keine KI nutzen durften. DeepRare erhielt dieselben Symptomdaten. Das System erreichte nicht nur bei fünf Vermutungen dieselbe Trefferquote wie die Kliniker, sondern übertraf deren Genauigkeit bei der einzelnen Top‑Vorhersage. Eine weitere Gruppe von zehn seltenen‑Krankheiten‑Ärztinnen und ‑Ärzten prüfte die Begründungsketten der KI für 180 Fälle und bewertete über 95 % der zitierten Belege als korrekt und relevant — ein Hinweis darauf, dass die Erklärungen medizinisch verlässlich sind und nicht bloß „KI‑Geschichten“.

Warum nachvollziehbare Schlussfolgerungen den Unterschied machen

Über die reine Genauigkeit hinaus argumentieren die Autorinnen und Autoren, dass DeepRare die Untersuchung seltener Erkrankungen grundlegend verändern könnte. Da das System jeden Schritt seiner Argumentation mit medizinischen Quellen und ähnlichen Patienten verknüpft, kann es die Zeit, die eine behandelnde Person mit der Recherche in der Literatur oder in Fall‑Datenbanken verbringt, drastisch verkürzen. Seine starke Leistung über viele Organsysteme hinweg bedeutet, dass es Ärztinnen und Ärzte ohne Spezialausrichtung helfen könnte, seltene Erkrankungen zu erkennen, die ihnen selten begegnen — insbesondere in Kliniken ohne eigene Zentren für seltene Krankheiten. Die Studie weist auf offene Herausforderungen hin, etwa Verwechslungen zwischen ähnlich auftretenden Syndromen und die Notwendigkeit, das System für Früherkennung und Behandlungsplanung auszubauen. Dennoch deuten die Befunde darauf hin, dass sorgfältig gestaltete KI‑Teammitglieder wie DeepRare die diagnostische Odyssee für Tausende von Familien verkürzen könnten, indem sie seltene Erkrankungen im klinischen Alltag leichter erkennbar und nachvollziehbar machen.

Figure 2
Figure 2.

Zitation: Zhao, W., Wu, C., Fan, Y. et al. An agentic system for rare disease diagnosis with traceable reasoning. Nature 651, 775–784 (2026). https://doi.org/10.1038/s41586-025-10097-9

Schlüsselwörter: Diagnostik seltener Erkrankungen, medizinisierte KI, große Sprachmodelle, klinische Entscheidungsunterstützung, genomische Medizin