Clear Sky Science · it
Un modello vision transformer per la rilevazione del glaucoma da fotografie del disco ottico
Perché questo conta per la vista di tutti i giorni
Il glaucoma è una delle principali cause di cecità permanente nel mondo, e spesso avanza in modo silenzioso senza sintomi fino a quando la vista non è già gravemente compromessa. La buona notizia è che semplici fotografie della parte posteriore dell’occhio sono ampiamente disponibili, anche in cliniche con risorse limitate. Questo studio esplora se un programma informatico avanzato può esaminare quelle immagini e segnalare in modo affidabile i primi segni di glaucoma, molto prima che la maggior parte delle persone noti problemi.
Una minaccia silenziosa per la vista
Il glaucoma danneggia lentamente il nervo ottico, il fascio di fibre che porta i segnali visivi dall’occhio al cervello. I medici cercano cambiamenti nel disco ottico, il punto in cui il nervo esce dall’occhio, ma interpretare queste forme sottili è difficile e anche gli esperti spesso non sono d’accordo. In molte aree del mondo mancano inoltre specialisti oculari sufficienti per sottoporre a screening ampie popolazioni. Di conseguenza, si stima che circa la metà dei casi di glaucoma nel mondo rimanga non diagnosticata, soprattutto nei paesi a basso e medio reddito, e molte persone scoprono di avere la malattia solo dopo aver già perso una parte significativa della vista.
Insegnare a un computer a leggere le foto oculari
I ricercatori hanno raccolto più di mille fotografie del disco ottico da persone con glaucoma precoce trattate in un centro oculistico statunitense, insieme a centinaia di immagini di occhi sani tratte da due database pubblici. Specialisti del glaucoma hanno classificato ogni immagine come glaucomatosa o sana basandosi solo sull’aspetto del nervo ottico, escludendo occhi con altri problemi retinici. Il team ha ritagliato ogni immagine in modo che il disco ottico occupasse una porzione simile del fotogramma e ha applicato controlli di qualità accurati e lievi modifiche realistiche alle immagini, come rotazioni, zoom e sfocature leggere, per ampliare il set di addestramento mantenendo condizioni vicine al mondo reale. 
Un nuovo tipo di rete neurale
Invece di affidarsi a sistemi di analisi immagini più tradizionali, il team ha costruito il modello su un "vision transformer", una famiglia più recente di strumenti di deep learning sviluppata inizialmente per riconoscere oggetti in fotografie di uso quotidiano. Questo modello divide ogni immagine del disco ottico in molte piccole patch, rappresenta ciascuna patch come un token di dati e poi usa strati di blocchi di attenzione per valutare come le diverse regioni del disco si relazionano tra loro. La rete produce un punteggio tra 0 e 1 che riflette la probabilità che l’occhio abbia il glaucoma, con punteggi pari o superiori a 0,5 considerati positivi. Per sfruttare al meglio i dati disponibili, i ricercatori hanno usato campionamento bilanciato, funzioni di perdita pesate e convalida incrociata, e hanno confrontato il transformer con una solida rete convoluzionale chiamata EfficientNet. 
Quanto bene il sistema ha riconosciuto la malattia precoce
Quando è stato testato su immagini mai viste prima, il modello vision transformer ha separato quasi perfettamente occhi glaucomatosi da occhi sani. La sua misura di prestazione principale, l’area sotto la curva ROC, è stata pari a 1,00 sul set di test, con un’accuratezza intorno al 99 percento, sensibilità molto elevata e specificità molto elevata. In termini pratici, il sistema ha mancato pochissimi casi di glaucoma e ha classificato come malate pochissime persone con occhi sani. Quando i ricercatori hanno poi sfidato il modello con quasi mille occhi con glaucoma da moderato ad avanzato, ha identificato correttamente tutti tranne uno. Il transformer ha inoltre superato l’approccio basato su EfficientNet, che mostrava minore accuratezza e più falsi allarmi e omissioni.
Cosa potrebbe significare per la cura degli occhi
Poiché il modello funziona con fotografie standard del disco ottico ed è stato addestrato su un gruppo di pazienti razzialmente diversificato, offre una visione realistica di come l’intelligenza artificiale potrebbe aiutare a eseguire lo screening del glaucoma in molte parti del mondo. Gli autori avvertono che il loro studio ha utilizzato una dimensione campionaria complessiva più piccola rispetto ad altri e si è appoggiato a dataset esterni per molti dei controlli sani, il che potrebbe introdurre bias nascosti. Sostengono che collezioni di immagini più grandi e più varie, immagini acquisite con fotocamere portatili e l’inclusione di informazioni di base del paziente come età o grado di miopia saranno passaggi importanti successivi. Tuttavia, i risultati suggeriscono che un’analisi intelligente di semplici fotografie oculari potrebbe diventare un modo conveniente per cogliere il glaucoma precocemente e ridurre la cecità evitabile, specialmente dove gli specialisti scarseggiano.
Messaggio chiave per i lettori
Questo lavoro mostra che un modello informatico avanzato può imparare a riconoscere le prime tracce del glaucoma da fotografie di routine del nervo ottico con accuratezza molto elevata. Pur necessitando di ulteriori test in cliniche reali, strumenti di questo tipo potrebbero un giorno aiutare i medici a smistare rapidamente grandi numeri di pazienti tra chi necessita cure oculistiche urgenti e chi no, rendendo la protezione precoce della vista più accessibile a livello globale.
Citazione: Bouris, E., Leyva, B.K., Odugbo, O.P. et al. A vision transformer model for the detection of glaucoma from optic disc photographs. Sci Rep 16, 14831 (2026). https://doi.org/10.1038/s41598-026-44662-7
Parole chiave: screening del glaucoma, fotografia del disco ottico, deep learning, vision transformer, salute degli occhi