Clear Sky Science · de

Multi-omics-Merkmalsengineering, angetrieben von biomedizinischen Foundation-Modellen, verbessert die Vorhersage der Arzneimittelantwort bei Patienten mit entzündlichen Darmerkrankungen

· Zurück zur Übersicht

Warum diese Forschung für Patientinnen und Patienten wichtig ist

Menschen mit entzündlichen Darmerkrankungen (IBD) erleben beim Beginn neuer Medikamente oft ein frustrierendes Trial-and-Error-Verfahren. Dasselbe Medikament kann bei einer Person schwere Darmentzündungen beruhigen, während es einer anderen kaum hilft. Diese Studie untersucht, wie leistungsfähige neue Künstliche-Intelligenz-(KI-)Modelle, ursprünglich entwickelt, um Biologie in großem Maßstab zu verstehen, dafür genutzt werden können, aus kleinen Patientendatensätzen deutlich mehr Erkenntnis zu gewinnen. Das Ziel ist einfach, aber ehrgeizig: Das genetische und molekulare Profil jedes Einzelnen zu verwenden, um im Voraus vorherzusagen, wie gut er oder sie auf ein gängiges IBD-Medikament reagieren wird.

Figure 1
Figure 1.

Große KI nutzen, um kleine Studien zu stärken

Traditionelle medizinische KI-Werkzeuge haben Schwierigkeiten, wenn die Patientenzahl gering ist, selbst wenn für jeden Patienten sehr umfassende Messungen vorliegen. In dieser Arbeit kehren die Forschenden dieses Problem um, indem sie Wissen aus einem riesigen „Foundation-Modell“ namens MAMMAL nutzen, das ursprünglich an gewaltigen Sammlungen von Protein- und Wirkstoffdaten trainiert wurde. Anstatt dieses Modell neu zu trainieren, verwenden sie es als intelligente Rechenmaschine, um abzuschätzen, wie stark ein bestimmtes Medikament an tausende menschliche Proteine bindet. Diese Bindungsstärkewerte werden dann zu neuen, informationsreichen Merkmalen, die in eher sparsamen Machine-Learning-Modelle für die 51 IBD-Patienten dieser Studie eingespeist werden können.

Blick in den Darm: DNA und RNA

Das Team arbeitete mit Gewebeproben aus den entzündeten Darmabschnitten von Personen mit Colitis ulcerosa oder Morbus Crohn. Aus jeder Probe maßen sie zwei zentrale biologische Ebenen: DNA, mit Fokus auf kleine genetische Veränderungen, sogenannte SNPs, und RNA, die widerspiegelt, wie aktiv jedes Gen im Gewebe ist. Sie setzten das Gewebe außerdem Prednisolon aus, einem standardmäßigen Steroid der ersten Wahl bei IBD, und maßen, wie stark ein wichtiger Entzündungssignalstoff, TNFα, als Reaktion abnahm. Diese TNFα-Änderung diente als Proxy dafür, wie gut das Gewebe des Patienten auf das Medikament reagierte. Die Herausforderung bestand darin, Tausende genetischer und molekularer Messwerte mit diesem Arzneimittelantwort-Ergebnis zu verknüpfen.

Den Modellen beibringen, worauf es ankommt

Der erste Schritt bestand darin zu entscheiden, welche Proteine und Gene für die Modelle am wichtigsten sein sollten. Mithilfe des Foundation-Modells schätzten die Forschenden, wie stark Prednisolon an mehr als 11.000 menschliche Proteine binden würde, und konzentrierten sich dann auf die oberen fünf Prozent mit der stärksten vorhergesagten Bindung. Ermutigend war, dass diese kurze Liste die bekannten Ziele des Medikaments und Proteine, die an chemischer Wahrnehmung und Signalübertragung beteiligt sind, enthielt — ein Hinweis darauf, dass die Rangfolge der KI biologisch sinnvoll war. Anschließend kombinierten sie diese Liste mit den DNA-Veränderungen jedes Patienten, erzeugten personalisierte „mutierte“ Proteinsequenzen und berechneten erneut, wie jede Mutation die Prednisolon-Bindung leicht stärken oder schwächen könnte. Diese vorhergesagten Verschiebungen in der Bindungsstärke wurden zu kompakten, patientenspezifischen Merkmalen, die erfassen, wie Varianten in Schlüsselproteinen die Medikamentenwirkung verändern könnten.

Figure 2
Figure 2.

Genetische Signale mit Genaktivität verschmelzen

Als Nächstes ergänzte das Team die Daten um die Genaktivität aus den RNA-Messungen, die aus demselben Darmgewebe stammten, das auch für die Medikamententests verwendet wurde. Für jedes priorisierte Protein kombinierten sie die vorhergesagte Bindungsstärke mit der Aktivität des entsprechenden Gens und multiplizierten beide Werte zusätzlich, um einen „Interaktionszustand“ zu erstellen, der sowohl widerspiegelt, wie stark das Medikament voraussichtlich bindet, als auch wie viel des Zielproteins vorhanden ist. Auf diesen angereicherten Merkmalen trainierte Machine-Learning-Modelle konnten Proben, die gut auf Prednisolon reagierten, besser von denen unterscheiden, die dies nicht taten, als Modelle, die lediglich einfachere Darstellungen derselben DNA-Daten verwendeten. Einige der einflussreichsten Merkmale wiesen auf Familien von geruchsbezogenen Rezeptoren und einen Rezeptor hin, der in das beruhigende Gehirnsignal GABA involviert ist — Hinweise auf bislang unterschätzte Rollen dieser Proteine bei Darmentzündungen und Steroidantworten.

Komplexe Werkzeuge für Nicht-Expertinnen und Nicht-Experten nutzbar machen

Über die Biologie hinaus adressierten die Forschenden auch eine praktische Hürde: In den meisten Laboren fehlt die Computerexpertise, große Foundation-Modelle selbst zu betreiben. Um dem zu begegnen, verpackten sie ihren Workflow zur Abschätzung der Bindungsaffinität in einen offenen Model Context Protocol (MCP)-Server, der direkt von KI-Assistenten wie Claude oder ChatGPT aufgerufen werden kann. Mit dieser Einrichtung kann eine Wissenschaftlerin oder ein Wissenschaftler in einfacher Sprache die vorhergesagte Bindung zwischen einem Medikament und einer Menge von Proteinen anfragen, während das System die technischen Schritte im Hintergrund übernimmt. Das senkt die Hemmschwelle für andere, ähnliche personalisierte Fragestellungen zur Arzneimittelantwort mit eigenen Daten zu untersuchen.

Was das für künftige Therapieentscheidungen bedeutet

Alltäglich formuliert zeigt diese Arbeit, wie ein einziges, leistungsfähiges KI-Modell, das an riesigen öffentlichen Datensätzen trainiert wurde, kleinen, realen Patientenstudien zu größerer Aussagekraft verhelfen kann. Indem rohe DNA-Veränderungen und Genaktivität in reichere, biologieinformierte Merkmale überführt wurden, verbesserten die Autorinnen und Autoren die Genauigkeit von Modellen, die vorhersagen, wer wahrscheinlich von Prednisolon profitieren wird. Die Ergebnisse sind noch vorläufig und basieren auf einer begrenzten Patientenzahl, sodass die konkret hervorgehobenen Gen–Wirkstoff-Verbindungen weiter validiert werden müssen. Die übergeordnete Strategie — Foundation-Modelle als intelligente Merkmalsgeneratoren zu nutzen und sie über einfache Schnittstellen zugänglich zu machen — deutet jedoch auf eine Zukunft hin, in der Ärztinnen und Ärzte Multi-Layer-Molekulartests, interpretiert durch KI, verwenden könnten, um für jede Person mit IBD das richtige Medikament und die richtige Dosis auszuwählen.

Zitation: Gardiner, LJ., Kelly, J., Evans, A. et al. Multi-omics feature engineering driven by biomedical foundation models improves drug response prediction for inflammatory bowel disease patients. Sci Rep 16, 13820 (2026). https://doi.org/10.1038/s41598-026-44366-y

Schlüsselwörter: entzündliche Darmerkrankung, Vorhersage der Arzneimittelantwort, biomedizinische Foundation-Modelle, Multi-Omics, personalisierte Medizin