Clear Sky Science · it
Un approccio di machine learning basato su kNN per automatizzare la valutazione della causalità degli eventi avversi
Perché questo è importante per chi assume farmaci
Quando un nuovo farmaco arriva sul mercato, la sua storia è solo all’inizio. Milioni di persone lo useranno nel mondo reale e alcune sperimenteranno problemi di salute che potrebbero o meno essere causati dal medicinale. Distinguere quali reazioni siano realmente correlate al farmaco è vitale per la sicurezza dei pazienti, ma oggi questo lavoro è lento, complesso e in gran parte manuale. Questo studio esplora come una forma semplice ma potente di intelligenza artificiale possa aiutare gli esperti a esaminare questi rapporti di sicurezza in modo più rapido e coerente, senza sostituire il giudizio umano che in ultima istanza protegge i pazienti.
Come le storie di sicurezza diventano dati
Case farmaceutiche e autorità regolatorie si basano su report di sicurezza di casi individuali, che sono riepiloghi strutturati delle esperienze reali delle persone con i farmaci. Ogni rapporto può includere cosa è andato storto (per esempio, un mal di testa o un problema epatico), quanto è stato grave, quali altri farmaci e malattie erano presenti e cosa pensava il revisore originale riguardo al legame con il farmaco. Per oltre 800.000 di questi rapporti relativi a sei farmaci commercializzati, i revisori medici dell’azienda avevano già stabilito se ogni evento avverso fosse correlato al farmaco, non correlato o impossibile da giudicare a causa di informazioni mancanti o conflittuali. I ricercatori hanno usato questo ricco archivio storico come materiale di addestramento per un modello informatico che imparasse a imitare quelle decisioni umane su nuovi casi.

Insegnare a un computer a riconoscere casi simili
Invece di costruire un sistema a scatola nera, il team ha scelto un metodo particolarmente trasparente chiamato “nearest neighbors”. L’idea è intuitiva: se due casi sembrano molto simili, probabilmente condividono la stessa conclusione su se il farmaco abbia causato il problema. Per catturare la similarità, i ricercatori hanno rappresentato ogni evento avverso come un profilo in sette parti, includendo il termine medico per l’evento, cosa è successo quando il farmaco è stato sospeso e riassunto, se il problema era atteso per quel medicinale, l’opinione di chi ha segnalato, altri farmaci assunti, la storia medica e la gravità dell’evento. Hanno quindi misurato quanto fossero vicini due casi in questo spazio a sette dimensioni, dando più peso alle caratteristiche che contano di più per la causalità, come l’evento esatto e cosa è successo al cambiamento del trattamento.
Dalla vicinanza a una decisione a tre vie
Quando arriva un nuovo rapporto, il modello esamina i dati storici per trovare i dieci casi più simili. Controlla poi come quei vicini erano stati classificati e li lascia “votare” tra tre esiti ampi: probabilmente correlato al farmaco, non correlato o improbabile, e non valutabile. Questa suddivisione a tre vie rappresenta un equilibrio tra la sfumatura clinica e le prestazioni affidabili. Testato su più di 250.000 eventi precedentemente non visti, il modello ha rispecchiato da vicino i revisori umani per gli eventi considerati correlati e per quelli giudicati non valutabili, con bassi tassi di errore e punteggi solidi che combinano accuratezza e completezza. Ha avuto più difficoltà con il gruppo più piccolo di eventi chiaramente non correlati, riflettendo la sfida che i sistemi di apprendimento automatico affrontano quando un tipo di esempio è relativamente raro.

Ridurre la nebbia del “non è possibile dire”
Un problema pratico nel lavoro di sicurezza nel mondo reale è che l’etichetta “non valutabile” può diventare un contenitore quando le informazioni sono scarse o ambigue, rendendo più difficile identificare i veri schemi di sicurezza. I ricercatori hanno aggiunto uno strumento di messa a punto che rende il modello più cauto nell’assegnare questa etichetta. Invece di scegliere “non valutabile” ogni volta che ottiene una semplice maggioranza tra i casi simili, il modello ora richiede una percentuale più alta di vicini a favore di quell’opzione. Aumentando questa soglia, il team è riuscito a ridurre drasticamente la frequenza con cui il modello definiva un caso non valutabile e a migliorare le prestazioni per le altre due categorie, a costo di un aumento di disaccordo per gli eventi più difficili da giudicare. Una dashboard web-based permette ai revisori medici di regolare questa soglia per prodotto, vedere istantaneamente come cambia l’equilibrio degli esiti e concentrare la loro attenzione sui casi in cui il modello e gli esseri umani non sono d’accordo.
Cosa significa per la sicurezza dei farmaci in futuro
Per un campione di casi recenti che i revisori umani avevano etichettato come non valutabili, il sistema ha evidenziato centinaia di casi in cui la sua conclusione differiva. Quando revisori senior li hanno riesaminati, hanno concordato con il modello più di due volte su tre, dimostrando che tali strumenti possono segnalare schemi trascurati e supportare la supervisione della qualità piuttosto che sostituire gli esperti. Il lavoro dimostra che un approccio chiaro, basato sulla similarità, può integrare l’intelligenza artificiale nella sicurezza dei farmaci in modo spiegabile, regolabile e coerente con la pratica medica. Con l’accumularsi di più dati e l’aggiunta di narrazioni testuali usando moderne tecnologie del linguaggio, sistemi di questo tipo potrebbero aiutare a garantire che i rischi emergenti vengano individuati prima, mantenendo però i clinici saldamente al comando delle decisioni finali.
Citazione: Ren, J., Carroll, H., McCarthy, K. et al. A kNN based machine learning approach to automating causality assessment of adverse events. Sci Rep 16, 9140 (2026). https://doi.org/10.1038/s41598-026-40267-2
Parole chiave: farmacovigilanza, eventi avversi da farmaci, valutazione della causalità, apprendimento automatico, k nearest neighbors