Clear Sky Science · it
Generalizzazione cognitiva simile a quella umana per grandi modelli tramite supervisione guidata da rappresentazioni mentali
Perché insegnare all’IA a pensare come noi è importante
L’intelligenza artificiale moderna sa riconoscere volti, etichettare foto e scrivere testi scorrevoli, ma fatica ancora con quel tipo di comprensione flessibile che le persone usano quotidianamente. Possiamo vedere un uccello e poi riconoscere molte specie diverse, oppure capire che un’amaca e un passeggino condividono l’uso del coricarsi per riposare. Questo articolo esplora un nuovo modo per avvicinare i modelli computazionali a quel tipo di pensiero simile a quello umano usando l’attività cerebrale stessa come segnale di insegnamento.
Dove gli odierni sistemi intelligenti mostrano limiti
I sistemi di deep learning standard diventano più capaci soprattutto ingrandendo le architetture e addestrandole con più dati. Questa ricetta funziona bene per compiti concreti come riconoscere calzini, cigni o automobili nelle immagini. Tuttavia, gli autori mostrano che aggiungere semplicemente più parametri apporta scarsi miglioramenti nella comprensione di idee astratte come abbigliamento, uccelli o la più ampia distinzione tra esseri viventi e non viventi. Nei test di one-shot learning, i modelli miglioravano fortemente su oggetti specifici quando crescevano, ma miglioravano di poco o addirittura peggioravano su categorie di livello superiore. Le analisi di come i modelli separano internamente i concetti hanno rivelato che, a differenza del cervello umano, non raggruppavano naturalmente gli esseri viventi separandoli da strumenti e altri oggetti.

Lasciare che il cervello guidi la macchina
Per colmare questo divario, i ricercatori hanno ideato quella che chiamano supervisione guidata dalle rappresentazioni mentali. I volontari sono stati posti in uno scanner cerebrale mentre osservavano molte immagini naturali. Da queste registrazioni il team ha estratto pattern di attività in aree della corteccia visiva note per codificare informazioni ricche e di alto livello su ciò che vediamo. Allo stesso tempo, una rete artificiale ha elaborato le stesse immagini. L’idea chiave era forzare la struttura interna di somiglianze e differenze tra oggetti del modello a corrispondere alla struttura riscontrata nel cervello. Gli autori hanno trattato sia il cervello sia il modello come grafi di concetti interconnessi e hanno usato una procedura iterativa di matching dei grafi per avvicinarli.
Come si comportano i modelli allineati al cervello
Dopo questo addestramento speciale, i modelli non si sono limitati a memorizzare le immagini supervisionate. Hanno invece sviluppato una mappa dei concetti più simile a quella umana che si è generalizzata a molti nuovi oggetti mai associati ai dati cerebrali. I modelli migliorati sono diventati molto più bravi nel one-shot learning per categorie astratte, mostrando cluster più compatti per concetti come animale, veicolo o strumento musicale. Le loro gerarchie interne hanno iniziato a somigliare a WordNet, un database costruito a mano delle relazioni tra parole inglesi, nonostante i modelli non fossero mai stati addestrati esplicitamente su quella struttura. Quando dovevano scegliere “l’intruso” tra tre immagini, i modelli guidati dal cervello selezionavano opzioni più in linea con ampi insiemi di giudizi umani. Si sono inoltre dimostrati più difficili da ingannare con piccole distorsioni appositamente create sulle immagini, suggerendo una comprensione più profonda e robusta di cosa siano gli oggetti.
Una finestra su uno spazio concettuale più umano
Gli autori sono andati oltre ed esaminate la “varietà concettuale”, ovvero la mappa a bassa dimensione che sottende i modelli allineati al cervello. Muovendosi su questa mappa e decodificando punti in descrizioni in linguaggio naturale, hanno mostrato che posizioni vicine corrispondevano a idee semanticamente affini, come diversi tipi di abbigliamento o di veicoli. Interpolando tra regioni si ottenevano transizioni regolari, per esempio scivolando da dispositivi elettronici verso animali e atterrando su cavalli quando si attraversava la zona tra veicoli e mammiferi ungulati. Il sistema poteva anche sintetizzare più immagini correlate in una singola frase significativa ed eseguire una semplice “aritmetica dei concetti”, modificando didascalie aggiungendo o sottraendo elementi come cavallo o motocicletta in un modo coerente con l’intuizione umana.

Cosa significa questo per l’IA futura
In termini pratici, questo lavoro suggerisce che dare ai sistemi di IA una spinta proveniente dal cervello umano può aiutarli a superare il puro riconoscimento di pattern verso qualcosa di più vicino al nostro modo di organizzare la conoscenza. Piuttosto che limitarsi a ingrandire i modelli, lo studio mostra che modellare il loro spazio concettuale interno in modo da rispecchiare la struttura cerebrale può aumentare la capacità di affrontare situazioni nuove, astratte e insolite. Sebbene l’approccio dipenda ancora da scansioni cerebrali dettagliate di singole persone, l’espansione di questo tipo di addestramento informato dal cervello potrebbe portare a sistemi artificiali più adattabili, interpretabili e allineati a come gli esseri umani percepiscono e ragionano sul mondo.
Citazione: Chen, J., Qi, Y., Wang, Y. et al. Human-like cognitive generalization for large models via mental representation-guided supervision. Nat Commun 17, 4709 (2026). https://doi.org/10.1038/s41467-026-71267-5
Parole chiave: apprendimento guidato dal cervello, concetti astratti, reti neurali profonde, gerarchia dei concetti, generalizzazione cognitiva