Clear Sky Science · it

Garantire l’integrità dei modelli di IA: un approccio basato su blockchain per proteggere i dati di addestramento delle immagini mediche

· Torna all'indice

Perché è importante proteggere le scansioni mediche

Quando i medici usano l’intelligenza artificiale per individuare tumori cerebrali nelle risonanze magnetiche, ripongono una fiducia enorme nei dati e nel software. Ma cosa succede se qualcuno modifica silenziosamente quelle immagini in modo che l’IA impari lezioni sbagliate — o interpreti un tumore come innocuo? Questo articolo esplora come la combinazione di tecnologia blockchain e archiviazione distribuita possa «congelare» le immagini mediche fin dal momento della loro creazione, aiutando a garantire che decisioni di vita o di morte non si basino su dati corrotti.

Figure 1
Figure 1.

La minaccia nascosta nelle immagini mediche

I moderni sistemi di IA, in particolare i modelli di deep learning, possono rilevare pattern sottili nelle immagini cerebrali da risonanza che gli esseri umani potrebbero non notare, aumentando l’accuratezza e alleggerendo il carico di lavoro dei medici. Tuttavia questi modelli sono affidabili solo quanto le immagini su cui vengono addestrati. Gli avversari possono eseguire attacchi di “avvelenamento dei dati” inserendo nel set di addestramento scansioni RMN leggermente alterate. Le modifiche sono così piccole che gli esseri umani non le vedono, ma possono spingere il modello di IA verso errori pericolosi, come classificare sistematicamente in modo errato un tipo di tumore. Modifiche analoghe possono essere applicate nella fase di test, dove un aggressore altera sottilmente una singola scansione per ingannare un modello in produzione e ottenere una diagnosi errata. Poiché le pipeline attuali di imaging medico spesso non forniscono garanzie solide sull’origine dei dati e sulla loro integrità, questi attacchi sono difficili da rilevare e potrebbero avere conseguenze letali.

Perché le difese esistenti non bastano

I ricercatori hanno provato diverse tattiche per difendere i modelli di IA, ma la maggior parte affronta i sintomi più che le cause. L’addestramento adversariale espone i modelli a molti esempi manipolati in modo che imparino a resistere ad alcuni attacchi, ma questo è costoso in termini computazionali e tende a proteggere solo contro tecniche note. Metodi di “pulizia” delle immagini, come la compressione o la riduzione del rumore, possono rimuovere alcune perturbazioni ma possono fallire di fronte ad attacchi più sofisticati e non dimostrano l’origine dei dati. Altri approcci, come il watermarking digitale o hardware speciali sicuri, offrono funzionalità utili come il rilevamento delle manomissioni o l’esecuzione protetta, ma presuppongono che le immagini che entrano nel sistema siano già affidabili. Nessuno di questi metodi fornisce un registro end‑to‑end di ogni immagine medica dal momento in cui viene acquisita dalla macchina fino allo stoccaggio, alla condivisione e all’uso per l’addestramento dell’IA.

Una nuova pipeline dei dati basata sulla fiducia condivisa

Gli autori propongono una nuova architettura che comincia a proteggere le immagini non appena vengono create in un centro diagnostico. Nel loro progetto cooperano tre ruoli: il DataOwner (per esempio il reparto di imaging di un ospedale) che genera le RMN, il DataCustodian che gestisce lo stoccaggio sicuro e i permessi, e il ResearchCenter che addestra i modelli di IA. Invece di mettere le immagini direttamente sulla blockchain — operazione lenta e pesante — i file RMN grezzi vengono conservati in una rete privata isolata di nodi di archiviazione distribuita chiamata Private IPFS. Ogni immagine riceve un’impronta crittografica unica, o identificatore di contenuto, che cambia anche se viene alterato anche un singolo pixel. Tale impronta, insieme alle informazioni su chi ha caricato l’immagine e quando, viene quindi scritta su una blockchain permissioned costruita su Hyperledger Fabric, condivisa solo tra organizzazioni autorizzate.

Figure 2
Figure 2.

Come il sistema impedisce le manomissioni

Ogni volta che un ricercatore vuole usare le immagini, invia una richiesta firmata digitalmente che viene registrata sulla blockchain. Solo le parti autorizzate possono approvare tale richiesta, e l’approvazione stessa diventa parte del registro permanente. Il ricercatore recupera quindi l’immagine dalla rete di archiviazione privata e ricalcola la sua impronta. Se la nuova impronta non corrisponde a quella memorizzata sulla blockchain, l’immagine viene segnalata come manomessa e bloccata dall’entrare nella pipeline di addestramento dell’IA. Questo crea una traccia completamente verificabile e resistente alle manomissioni: ogni caricamento, richiesta di accesso, approvazione e recupero è registrato su più computer indipendenti, rendendo molto più difficile la manipolazione silenziosa. Gli autori hanno implementato questo progetto con immagini RMN reali di tumori cerebrali, ne hanno misurato le prestazioni usando uno strumento chiamato Hyperledger Caliper e hanno dimostrato che può gestire caricamenti sicuri quasi in tempo reale con bassi tassi di errore e ritardi gestibili.

Cosa significa questo per un’IA più sicura negli ospedali

In termini semplici, il sistema proposto funziona come una cassaforte trasparente e chiusa per le immagini mediche. Tutti possono vedere quando una scansione entra o esce dalla cassaforte, e qualsiasi tentativo di alterarla lascia impronte evidenti. Combinando una blockchain permissioned con archiviazione distribuita privata e rigorosi controlli di accesso, il framework affronta la radice del problema: impedisce che immagini avvelenate o contraffatte raggiungano mai il modello di IA. Sebbene rimangano sfide pratiche — come collegare questa soluzione ai software ospedalieri esistenti e districarsi tra normative complesse sulla privacy — l’approccio offre una strada promettente verso strumenti di IA di cui clinici e pazienti possano fidarsi, soprattutto in ambiti ad alta criticità come la diagnosi dei tumori cerebrali.

Citazione: Shinde, R., Patil, S., Kotecha, K. et al. Ensuring the integrity of AI models: a blockchain-based approach for protecting medical imaging training data. Sci Rep 16, 13989 (2026). https://doi.org/10.1038/s41598-026-44040-3

Parole chiave: sicurezza delle immagini mediche, blockchain in ambito sanitario, attacchi adversariali, risonanza magnetica tumore cerebrale, IA affidabile