Clear Sky Science · it

Un autoencoder generativo perturbazione-recupero per grafi eterogenei con attributi mancanti

· Torna all'indice

Perché i dati disordinati nelle reti contano

Dalle raccomandazioni di film ai motori di ricerca accademici e alla scoperta di farmaci, molti strumenti moderni si basano su reti che collegano tipi diversi di entità: persone, articoli, aziende, film o proteine. Queste reti, chiamate grafi eterogenei, non solo registrano chi è collegato a chi, ma associano anche informazioni descrittive a ciascun nodo, come la trama di un film o i tag di un ristorante. In realtà, gran parte di queste informazioni è mancante o rumorosa, il che indebolisce silenziosamente la qualità delle predizioni basate su queste reti. Questo articolo introduce un nuovo modo di addestrare modelli su grafi imperfetti in modo che possano gestire meglio lacune ed errori nei dati.

Figure 1
Figure 1.

Reti di molteplici tipi di entità

A differenza delle semplici reti sociali in cui ogni nodo è una persona e ogni collegamento è un’amicizia, i grafi eterogenei mescolano diversi tipi di nodi e di archi. Un grafo accademico può collegare autori, articoli e sedi di pubblicazione; un grafo di un sito di recensioni può collegare utenti, attività commerciali e recensioni. Ogni nodo è dotato di attributi: le parole chiave di un articolo, le preferenze di un utente o la sinossi di un film. Quando questi attributi sono incompleti o corrotti, i metodi standard per i grafi faticano a imparare rappresentazioni interne affidabili dei nodi. Questo a sua volta danneggia i compiti a valle come classificare il campo di un articolo, raggruppare attività simili o raccomandare film. Gli approcci precedenti in genere cercavano di riempire gli attributi mancanti una sola volta, usando regole fisse, e poi addestravano i modelli su questa versione singola e

Citazione: Wang, Q., Shao, X. & Huang, X. A perturbation-recovery generative autoencoder for heterogeneous graphs with attributes missing. Sci Rep 16, 13538 (2026). https://doi.org/10.1038/s41598-026-44190-4

Parole chiave: grafi eterogenei, attributi mancanti, autoencoder per grafi, apprendimento delle rappresentazioni, apprendimento auto-supervisionato