Clear Sky Science · it

Classificazione accurata delle lesioni cutanee su immagini dermatoscopiche sbilanciate con alta varianza tramite il framework SCTFD

2026-03-05 · Torna all'indice

Perché controlli della pelle più intelligenti sono importanti

Il cancro della pelle è uno dei tumori più comuni, ma è anche tra quelli più curabili se individuato precocemente. I dermatologi si affidano sempre più frequentemente a fotografie ravvicinate di nei e macchie, scattate con un ingranditore portatile chiamato dermatoscopio, per decidere quali siano pericolosi. Tuttavia interpretare queste immagini è difficile, anche per gli esperti, e i sistemi informatici che potrebbero assisterli spesso falliscono perché alcuni tipi di cancro sono rari e le lesioni possono apparire molto diverse da un paziente all’altro. Questo studio presenta un nuovo framework di intelligenza artificiale (AI), chiamato SCTFD, progettato per rendere la classificazione automatica delle lesioni cutanee più accurata e affidabile proprio in queste situazioni difficili.

La sfida delle macchie cutanee rare e insidiose

Le raccolte di immagini cutanee del mondo reale sono ben lungi dall’essere bilanciate. Nei comuni e per lo più innocui compaiono migliaia di volte nei dati di addestramento, mentre tumori gravi come il melanoma o neoplasie rare compaiono solo poche centinaia di volte o meno. Allo stesso tempo, le lesioni della stessa malattia possono variare molto per dimensione, colore e forma. I sistemi AI standard tendono a sovradattarsi ai pattern comuni e a trascurare quelli rari, il che è pericoloso in medicina: è peggio non riconoscere un melanoma che confondere un neo innocuo. Strategie classiche, come clonare semplicemente immagini rare o mescolarle tra loro, o usare modelli generativi complessi, presentano limiti in termini di realismo, stabilità o costi computazionali. SCTFD è stato costruito appositamente per gestire questo sbilanciamento e questa variabilità mantenendo al contempo un’efficienza adeguata all’uso pratico.

Creare esempi di addestramento migliori

Il primo blocco costitutivo di SCTFD è un generatore di dati chiamato CN-SMOTE. Invece di interpolare solo valori di pixel o addestrare una rete generativa avversaria fragile, CN-SMOTE utilizza una coppia encoder–decoder: una rete comprime un’immagine dermatoscopica in un codice interno compatto e un’altra la ricostruisce in immagine. Una volta appreso questo spazio compatto, il metodo trova vicini nello spazio dei codici tra le lesioni delle classi rare e interpola tra i loro codici, quindi decodifica questi codici misti per ottenere nuove immagini. Una penalità di addestramento specifica mantiene i codici interni delle lesioni dello stesso tipo vicini tra loro, in modo che le immagini sintetiche restino realistiche e fedeli alla malattia sottostante. Il risultato è una collezione più ampia e più bilanciata di immagini dermatoscopiche in cui i tipi di lesione rari ma importanti sono meglio rappresentati.

Vedere sia i dettagli sia il quadro d’insieme

Il secondo componente, MARD-Net, si concentra sul trasformare ogni immagine in un ricco insieme di caratteristiche indicative. Gli strati convoluzionali funzionano come lenti d’ingrandimento regolabili che captano pattern fini come bordi e texture. Su questo, un modulo di attenzione insegna alla rete a concentrarsi sulla piccola regione in cui si trova effettivamente la lesione, minimizzando la pelle sana circostante che potrebbe distrarre il modello. Infine, uno stadio basato su Transformer osserva l’intera immagine per catturare relazioni tra parti distanti della lesione, come l’assetto di colori e strutture differenti. Per evitare il carico computazionale tipico dei Transformer, gli autori introducono una strategia a finestra scorrevole che permette al modello di ottenere una visione ampia della lesione eseguendo calcoli di attenzione focalizzati solo in regioni selezionate, rendendolo più veloce ed efficiente in memoria.

Orientare il modello a trattare ogni classe in modo equo

Il terzo pilastro di SCTFD è un nuovo obiettivo di addestramento chiamato FDLoss, che indica all’AI come aggiustarsi durante l’apprendimento. Invece di contare ogni immagine allo stesso modo, FDLoss enfatizza i casi difficili e rari in modo che il modello non possa semplicemente "allentare" ottenendo buoni risultati sulle classi abbondanti e facili. Combina idee di due funzioni di valutazione popolari: una che premia un buon equilibrio tra sensibilità e precisione e un’altra che riduce il peso degli esempi banali che la rete classifica già correttamente. Inoltre, FDLoss aggiunge un termine che incoraggia le immagini della stessa malattia a formare gruppi compatti nello spazio interno del modello, spingendo invece le malattie diverse più lontane. Questa combinazione contrasta direttamente sia lo sbilanciamento delle classi sia l’ampia variazione all’interno di ogni classe che tipicamente confonde i classificatori.

Quanto bene funziona il nuovo approccio

Gli autori hanno testato SCTFD su due benchmark internazionali ampiamente usati per immagini cutanee, ISIC 2018 e ISIC 2019, che contengono decine di migliaia di immagini dermatoscopiche cliniche reali distribuite rispettivamente su sette e otto tipi di lesioni, e sono fortemente sbilanciati verso i nei comuni. In confronto a diversi metodi all’avanguardia, SCTFD ha raggiunto maggiore accuratezza e un bilanciamento chiaramente migliore tra il catturare i veri positivi ed evitare falsi allarmi. Ha migliorato l’accuratezza complessiva a circa il 93% su ISIC 2018 e al 91% su ISIC 2019, e ha portato il punteggio F1 — una misura che equilibra omissioni e errori di etichettatura — oltre tutti i sistemi concorrenti. Le visualizzazioni hanno mostrato che i suoi moduli di attenzione si concentrano sulle regioni della lesione e che le caratteristiche di malattie diverse diventano più nettamente separate dopo l’addestramento.

Cosa significa questo per pazienti e medici

Per i pazienti, la promessa di SCTFD è un secondo parere più affidabile quando compare una macchia sospetta sulla pelle. Sintetizzando esempi realistici di tumori rari, concentrandosi sulle parti più informative di ogni immagine e addestrando con una funzione di perdita che impone una chiara separazione tra i tipi di malattia, il framework riduce il rischio che i sistemi automatizzati trascurino lesioni pericolose semplicemente perché sono poco comuni o atipiche. Pur non sostituendo il giudizio di un dermatologo, questo approccio potrebbe abbassare la barriera a una diagnosi precoce e accurata in ambulatori e piattaforme di telemedicina, intercettando potenzialmente i tumori cutanei pericolosi per la vita in modo più tempestivo e coerente.

Citazione: Li, X., Ouyang, J., Chen, Y. et al. Accurate skin lesion classification on imbalanced dermoscopic images with high variance via the SCTFD framework. Sci Rep 16, 12302 (2026). https://doi.org/10.1038/s41598-026-37846-8

Parole chiave: rilevamento del cancro della pelle, dermoscopia AI, classificazione di immagini mediche, dataset sbilanciati, deep learning in dermatologia