Clear Sky Science · it

Meccanismi neurali e computazionali alla base dell’apprendimento percettivo one-shot negli esseri umani

2026-02-04 · Torna all'indice

Vedere l’immagine nascosta

Molti hanno sperimentato quel repentino momento “aha!” in cui un’immagine confusa in bianco e nero a macchie si trasforma all’improvviso in una figura chiara — un cane o un volto — e, una volta vista, non la si riesce più a non vedere. Questo studio indaga come una singola, breve occhiata a un’immagine nitida possa modificare in modo duraturo ciò che vediamo in una versione confusa e cosa questo riveli su come i nostri cervelli — e i futuri sistemi di intelligenza artificiale — apprendono da un solo esempio.

Da macchie sfocate al riconoscimento istantaneo

I ricercatori hanno usato le classiche “immagini di Mooney”: fotografie estremamente semplificate in bianco e nero, difficili da riconoscere finché non si vede la foto in scala di grigi originale da cui derivano. I volontari hanno prima cercato di nominare ciò che vedevano in queste immagini difficili. Successivamente hanno osservato brevemente le foto nitide corrispondenti e hanno poi riprovato con le immagini difficili. Dopo quella singola esposizione, le persone riuscivano improvvisamente a riconoscere le immagini un tempo misteriose, e questo miglioramento è perdurato. Modificando con cura le foto chiare — ribaltandole orizzontalmente, ruotandole, cambiandone le dimensioni o spostandone la posizione sullo schermo — il team ha mappato quale tipo di informazione visiva il cervello effettivamente conserva durante questo apprendimento one-shot.

Dove il cervello immagazzina la nuova intuizione

Diverse manipolazioni delle immagini influenzavano l’apprendimento in modi differenti. Ingrandire o ridurre l’immagine chiara del doppio o della metà non comprometteva l’apprendimento, suggerendo che il “modello” memorizzato dal cervello è flessibile rispetto alla scala. Ma ribaltare, ruotare o spostare l’immagine sullo schermo indeboliva l’apprendimento, sebbene non lo rendesse impossibile. Sostituire l’immagine nitida con un altro esemplare della stessa categoria — per esempio, un cane diverso — annullava completamente l’apprendimento. Questo dimostra che il cervello non si limita a memorizzare l’idea «questo è un cane»; conserva invece un ricordo dettagliato, simile a un’immagine, della forma e della disposizione specifica di quell’immagine esatta. Combinando questi risultati comportamentali con ciò che è noto sul sistema visivo, gli autori hanno indicato le aree visive di alto livello, più che le regioni visive precoci o strutture mnemoniche come l’ippocampo, come il probabile sito di immagazzinamento di questa nuova conoscenza.

Osservare l’apprendimento all’interno del cervello

Per confermare ciò, il team ha utilizzato scansioni MRI ultra ad alto campo a 7 Tesla e registrazioni dirette da elettrodi posizionati sul cervello di pazienti epilettici. Gli esperimenti con la risonanza hanno mostrato che i neuroni in una regione chiamata corteccia visiva di alto livello rispondevano a versioni diverse dello stesso oggetto (cambiate in scala, posizione o orientamento) esattamente nel modo previsto dai test comportamentali. Nelle registrazioni elettrodiche, il cambiamento cruciale è apparso prima in questa corteccia visiva di alto livello: dopo l’apprendimento, gli schemi di attività indotti dall’immagine difficile divenivano più simili a quelli indotti dalla sua controparte nitida, e questo avveniva in anticipo rispetto alle aree visive primarie. Questo timing suggerisce che tale regione è il luogo in cui il nuovo “prior” viene immagazzinato e riattivato, e che quindi invia feedback alle aree visive precedenti per aiutare a interpretare input ambigui.

Costruire una macchina che apprende in one-shot

I ricercatori hanno inoltre costruito un modello di rete neurale profonda progettato per imitare questa capacità. Il loro sistema utilizzava un moderno vision transformer come motore visivo “bottom-up”, abbinato a un modulo speciale che immagazzina informazioni prioritarie e invia feedback “top-down” quando in seguito vede un’immagine correlata. Addestrato su compiti simili alle immagini di Mooney, il modello ha mostrato un autentico apprendimento one-shot: la sua accuratezza è aumentata dopo una sola esposizione all’immagine nitida e ha superato di gran lunga ciò che poteva essere spiegato da una semplice ripetizione. Condivideva persino molti degli stessi successi e insuccessi degli osservatori umani su immagini specifiche, e le caratteristiche interne apprese dalle immagini nitide potevano predire quali immagini le persone avrebbero o non avrebbero imparato a riconoscere. Quando il team ha confrontato le informazioni prioritarie memorizzate dal modello con le scansioni cerebrali umane, ha trovato la corrispondenza più stretta nelle stesse regioni visive di alto livello evidenziate dagli esperimenti.

Perché questo è importante per cervelli e macchine

Nel complesso, questi risultati suggeriscono che i nostri momenti improvvisi «adesso lo vedo!» nascono quando le aree visive di alto livello regolano rapidamente le loro connessioni dopo una singola esperienza, immagazzinando un prior dettagliato simile a un’immagine che può poi rimodellare il modo in cui interpretiamo input rumorosi. Questa forma di apprendimento rapida ma stabile, radicata nella corteccia visiva di alto livello e sostenuta dal feedback top-down, offre un progetto per costruire sistemi di IA in grado di imparare da pochissimi esempi. Fornisce inoltre un punto di partenza per comprendere cosa potrebbe andare storto quando la percezione si affida eccessivamente alle aspettative pregresse, come in alcune condizioni psichiatriche legate a allucinazioni.

Citazione: Hachisuka, A., Shor, J.D., Liu, X.C. et al. Neural and computational mechanisms underlying one-shot perceptual learning in humans. Nat Commun 17, 1204 (2026). https://doi.org/10.1038/s41467-026-68711-x

Parole chiave: apprendimento one-shot, percezione visiva, corteccia visiva di alto livello, apprendimento percettivo, reti neurali profonde