Clear Sky Science · it

Un predittore farmacocinetico basato su machine learning (EGFR-PROPK) per PROTAC mirati a EGFR

2026-02-16 · Torna all'indice

Progettazione di farmaci più intelligente per tumori difficili da trattare

Molti nuovi farmaci anticancro promettenti falliscono non perché non colpiscano il bersaglio, ma perché l’organismo li elimina troppo rapidamente, li accumula nei posti sbagliati o non li assorbe adeguatamente. Una nuova classe di medicinali chiamata PROTAC può distruggere proteine responsabili della malattia considerate un tempo “non attaccabili”, ma il loro comportamento nell’organismo è particolarmente difficile da prevedere. Questo studio presenta uno strumento di machine learning, EGFR-PROPK, progettato specificamente per prevedere come un insieme di PROTAC contro una proteina chiave nel cancro si distribuiscano nell’organismo, con l’obiettivo di aiutare gli scienziati a selezionare candidati farmacologici migliori in anticipo e risparmiare anni e risorse su piste infruttuose.

Nuovi farmaci che distruggono proteine e le loro sfide

I PROTAC sono farmaci atipici: invece di limitarsi ad inibire una proteina, la marcano per la distruzione mediante i meccanismi di smaltimento della cellula. Ogni PROTAC collega una porzione che si lega al bersaglio patologico a un’altra che recluta un “trituratore” cellulare, unite da un ponte flessibile. Questo progetto consente loro di colpire proteine che i farmaci tradizionali non riescono facilmente a raggiungere e spesso permette un legame temporaneo invece di un’occupazione costante del sito. Tuttavia, la stessa dimensione e complessità rendono i PROTAC difficili da somministrare e controllare nell’organismo. Tendono ad essere grandi, relativamente lipofili e fortemente legati alle proteine plasmatiche, elementi che complicano assorbimento, distribuzione, metabolismo ed eliminazione.

Perché le regole usuali sul comportamento dei farmaci non bastano

I farmacologi tradizionali usano numeri semplici, come peso molecolare, affinità per i grassi (LogP) e regole empiriche di “drug-likeness”, per stimare come un composto possa comportarsi nell’organismo. I ricercatori hanno iniziato chiedendosi se queste misure familiari potessero spiegare il comportamento di 100 PROTAC che prendono di mira il recettore del fattore di crescita epidermico (EGFR) — un motore chiave in molti tumori — in topi vivi. Si sono concentrati su tre proprietà principali: clearance (la velocità con cui l’organismo rimuove il farmaco), emivita (quanto a lungo il farmaco rimane in circolo) e volume apparente di distribuzione (quanto si diffonde nei tessuti). Confrontando queste proprietà con descrittori di base, i punti dati risultavano dispersi senza trend chiari, dimostrando che semplici regole chimiche non sono sufficienti per prevedere il comportamento dei PROTAC.

Addestrare un motore di predizione su misura

Per colmare questa lacuna, il team ha sviluppato EGFR-PROPK, un predittore di machine learning sintonizzato specificamente sui PROTAC diretti a EGFR. Hanno innanzitutto condotto studi su topi con 100 PROTAC diversi, misurandone clearance, emivita e volume di distribuzione dopo somministrazione. Ogni molecola è stata quindi descritta tramite diversi “impronte” ricche che codificano la sua struttura dettagliata e sono state calcolate 200 caratteristiche chimiche aggiuntive. Queste descrizioni numeriche sono state immesse in un modello basato su CatBoost, un algoritmo moderno che eccelle nell’identificare pattern in dati tabulari. Diversamente dagli strumenti generici, EGFR-PROPK è stato addestrato direttamente su risultati in vivo per PROTAC, permettendogli di apprendere relazioni sottili tra la forma complessa del linker, la dimensione complessiva e la persistenza del farmaco nel sangue o la sua diffusione nei tessuti.

Superare i modelli generici e rivelare sfumature nascoste

I ricercatori hanno confrontato EGFR-PROPK con piattaforme di predizione di largo uso sviluppate soprattutto per farmaci tradizionali a piccola molecola. Quando quei modelli generici sono stati applicati “così come sono” ai PROTAC, le loro previsioni sono risultate povere: i valori stimati di emivita, clearance e distribuzione tissutale spesso deviavano notevolmente dalle misure reali. Anche dopo che un modello concorrente è stato ottimizzato con dati PROTAC, è rimasto indietro. Al contrario, EGFR-PROPK ha raggiunto un accordo sostanzialmente migliore tra valori predetti e sperimentali, in particolare per emivita e clearance, con miglioramenti moderati per la distribuzione. Il modello ha anche gestito casi reali: due PROTAC con strutture molto simili ma comportamenti molto diversi sono stati distinti con maggiore precisione da EGFR-PROPK rispetto agli strumenti generici, sottolineando l’importanza di dati di addestramento specifici per i PROTAC.

Cartografare il paesaggio chimico e i suoi limiti

Oltre ai numeri di performance, il team ha verificato se i 100 PROTAC coprissero una vasta gamma di progetti o solo un angolo ristretto dello spazio chimico. Riducendo le molecole ai loro scaffold centrali e visualizzandole tra migliaia di PROTAC brevettati, hanno mostrato che il loro set copre molti tipi strutturali distinti, specialmente nei linker flessibili. Ciò significa che il modello è ben adatto per perfezionare PROTAC diretti a EGFR che condividono blocchi costitutivi chiave ma variano nel modo in cui le parti sono connesse. Allo stesso tempo, gli autori sottolineano che lo strumento è uno specialista di dominio: la sua accuratezza può diminuire per PROTAC costruiti attorno a bersagli o vie di degradazione completamente diverse, indicando la necessità di future espansioni e apprendimento di trasferimento tra dataset.

Cosa significa per i medicinali del futuro

Per i non esperti, la conclusione principale è che la “plumbing” di un farmaco nell’organismo — come viene assorbito, dove va e quanto rimane — può decretare il successo o il fallimento di una terapia anticancro promettente, e le scorciatoie usate per le piccole pillole non funzionano bene per i degradatori di nuova generazione come i PROTAC. Creando EGFR-PROPK, i ricercatori dimostrano che dati animali raccolti con cura, combinati con metodi avanzati di riconoscimento di pattern, possono offrire uno sguardo molto più preciso in fase precoce sul comportamento di queste molecole complesse. Questo tipo di predizione su misura dovrebbe aiutare i chimici a progettare PROTAC che non solo distruggono le proteine giuste ma le raggiungono anche ai livelli corretti, aprendo la strada a trattamenti più efficaci e sicuri contro i tumori resistenti.

Citazione: Zhang, R., Li, F., Liu, Y. et al. A machine learning-based pharmacokinetics predictor (EGFR-PROPK) for EGFR-targeting PROTACs. Commun Chem 9, 134 (2026). https://doi.org/10.1038/s42004-026-01938-3

Parole chiave: farmacocinetica dei PROTAC, degradatori mirati a EGFR, machine learning nella progettazione di farmaci, predizione ADMET, degradazione proteica mirata