Clear Sky Science · de
Entschlüsselung von DEL-Taschenmustern durch kontrastives Lernen
Warum das Betrachten von Protein‑„Taschen“ die Entwicklung neuer Medikamente beschleunigen kann
Moderne Wirkstoffentdecker können inzwischen Billionen winziger Moleküle gleichzeitig mit DNA‑codierten Bibliotheken, sogenannten DELs, testen. Trotzdem sind nur wenige dieser aus DELs stammenden Moleküle zu echten Medikamenten geworden. Ein großes fehlendes Puzzleteil ist die Kenntnis darüber, welche Proteine im Körper tatsächlich die richtigen Nischen und Vertiefungen — „Taschen“ — besitzen, an die DEL‑Moleküle andocken können. Diese Studie schließt diese Lücke, indem sie abbildet, wie erfolgreiche DEL‑Taschen aussehen, und ein KI‑Modell namens ErePOC entwickelt, um ähnliche Taschen im menschlichen Körper zu finden.
Wie DEL‑Technologie nach neuen Wirkstoffmolekülen sucht
DELs funktionieren ein wenig wie mit Barcodes versehene Angelköder. Chemiker befestigen kleine Kandidatenmoleküle an kurzen DNA‑Stücken, die als Identifikationsetiketten dienen, und setzen dann riesige Gemische dieser markierten Moleküle dem Zielprotein aus. Moleküle, die haften bleiben, werden durch Sequenzierung der DNA identifiziert. Dieser Ansatz ist schnell und kostengünstig, doch die Umwandlung von DEL‑Treffern in echte Medikamente bleibt schwierig. Ein Grund ist, dass DEL‑Moleküle bestimmte chemische Einschränkungen teilen, etwa in Bezug darauf, wie sie in Wasser synthetisiert werden und wie das DNA‑Etikett angehängt ist. Diese Einschränkungen bewirken, dass sie bestimmte Typen von Protein‑Taschen bevorzugen — Präferenzen, die bislang nicht systematisch kartiert waren.

Was eine Tasche für DEL‑Moleküle attraktiv macht
Die Autoren verglichen zunächst Tausende von Protein‑Taschen, die verschiedene Ligandentypen binden: gewöhnliche biologische Kleinmoleküle, von der FDA zugelassene Medikamente und DEL‑Treffer. Sie fanden heraus, dass DEL‑ und Medikamenten‑Taschen tendenziell größer und chemisch komplexer sind als Taschen für natürliche Liganden. Insbesondere sind DEL‑Taschen offener und hydrophober — sie begünstigen also ölige, wasserabweisende Wechselwirkungen — während sie gleichzeitig eine kleine, aber wichtige Menge polarer Kontaktstellen behalten, die die Bindung feinabstimmen. Bestimmte voluminöse Aminosäuren, die aromatische und hydrophobe Oberflächen bereitstellen, wie Tyrosin und Phenylalanin, treten in DEL‑ und Medikamentenbindungs‑Taschen häufiger auf als auf typischen Proteinoberflächen. Insgesamt ähneln DEL‑Taschen eher klassischen Arzneimittelbindungsstellen als gewöhnlichen Stoffwechselorten, zeigen jedoch eine zusätzliche Tendenz zu großen, hydrophoben Hohlräumen.
Ein KI‑Modell beibringen, die „Persönlichkeiten“ von Taschen zu erkennen
Um über einfache Größen‑ und Chemie‑Zählungen hinauszugehen, entwickelten die Forscher ErePOC, ein Repräsentationsmodell, das jede Bindungs‑Tasche als eine Art Fingerabdruck behandelt. Es beginnt mit Einbettungen aus Protein‑Sprachmodellen, die Muster aus Millionen von Sequenzen erfassen, und komprimiert die Informationen über die Reste, die eine Tasche bilden, zu einem kompakten numerischen Vektor. Mithilfe von kontrastivem Lernen wird ErePOC so trainiert, dass Taschen, die chemisch ähnliche Liganden binden, im abstrakten Raum nahe beieinander liegen, während Taschen für sehr unterschiedliche Moleküle auseinanderdriften. Als die Autoren diesen Raum visualisierten, bildeten Taschen, die dieselben Cofaktoren wie ATP oder Häm binden, klar getrennte Cluster — ein Hinweis darauf, dass das Modell gelernt hatte, Taschen nach funktionalem Verhalten und nicht nur nach der allgemeinen Proteinform zu gruppieren.
DEL‑freundliche Ziele im gesamten menschlichen Proteom finden
Mit trainiertem ErePOC projizierten die Forscher bekannte DEL‑Taschen, Medikamenten‑Taschen und Hunderttausende von Taschen aus experimentellen und vorhergesagten Proteinstrukturen in dieselbe Landschaft. DEL‑Taschen verteilten sich weit, was zeigt, dass DEL‑Screenings prinzipiell einen großen Teil des traditionellen „drugable“ Raums erreichen können, doch sie zeigten weiterhin klare Präferenzen für Regionen, die mit größeren, hydrophoben Taschen assoziiert sind. Das Team scannte daraufhin mehr als 23.000 von AlphaFold vorhergesagte menschliche Proteine, filterte nach gut definierten Taschen und fragte, welche denen bekannter DEL‑Taschen im ErePOC‑Raum am ähnlichsten sind. Sie identifizierten nahezu 2.800 menschliche Proteine mit Taschen, die erfolgreichen DEL‑Stellen stark ähneln, mit deutlicher Anreicherung in Familien wie Transferasen, Hydrolasen, Oxidoreduktasen, Chromatin‑Regulatoren und einigen RNA‑bindenden Proteinen. Nachfolgende computergestützte Docking‑Studien mit einer großen virtuellen DEL deuten darauf hin, dass diese von ErePOC markierten Taschen tatsächlich dazu neigen, DEL‑ähnliche Moleküle günstiger zu binden.

Warum das für die zukünftige Wirkstoffforschung wichtig ist
Für Nicht‑Spezialisten lautet die Kernbotschaft: Der Erfolg ultra‑großer chemischer Bibliotheken hängt genauso sehr davon ab, die richtigen Protein‑Taschen auszuwählen, wie von den Molekülen selbst. Diese Arbeit zeigt, dass DEL‑Treffer dazu neigen, aus Taschen zu stammen, die groß, flexibel und hydrophob sind, und stellt ein leistungsfähiges KI‑Werkzeug vor, das solche Taschen allein aus Sequenz oder Struktur erkennen kann. Indem man ErePOC einsetzt, um DEL‑Screenings auf Proteine zu fokussieren, deren Taschen bereits DEL‑kompatibel aussehen, können Wirkstoffforscher vielversprechendere Ziele priorisieren, verschwendete Screening‑Aufwände reduzieren und möglicherweise weniger erforschte Klassen wie Chromatin‑ und RNA‑bindende Proteine erschließen. Kurz gesagt liefert die Studie sowohl ein klareres Bild davon, wie eine „DEL‑bereite“ Tasche aussieht, als auch eine praktische Karte und Kompass, um viele weitere solcher Taschen im menschlichen Proteom zu finden.
Zitation: Zhang, W., Wang, Y., Zhan, R. et al. Deciphering DEL pocket patterns through contrastive learning. Nat Commun 17, 2810 (2026). https://doi.org/10.1038/s41467-026-69663-y
Schlüsselwörter: DNA-codierte Bibliotheken, Proteinbindungs-Taschen, kontrastives Lernen, KI in der Wirkstoffforschung, ErePOC