Clear Sky Science · it

L’apprendimento automatico scopre nuovi codici campioni

· Torna all'indice

Perché questo conta per la tua vita digitale

Ogni foto che invii, film che guardi in streaming o segnale inviato nello spazio è silenziosamente protetto da codici di correzione degli errori—trucchetti matematici che individuano e correggono le anomalie nei dati. Migliorare questi codici significa meno chiamate interrotte, internet più veloce, messaggi spaziali più affidabili e archiviazione dati più densa. Questo articolo mostra come l’intelligenza artificiale moderna, lo stesso tipo di tecnologia alla base dei grandi modelli linguistici, possa aiutare a scoprire codici “campioni” da record che superano quelli trovati in precedenza dagli esperti umani.

Figure 1
Figure 1.

Proteggere i messaggi dal rumore

Quando l’informazione viaggia—che sia via Wi‑Fi, cavi sottomarini o tra la Terra e veicoli spaziali lontani—può essere distorta dal rumore. I codici di correzione degli errori proteggono da questo aggiungendo bit extra progettati in modo accurato così che gli errori possano essere rilevati e spesso riparati. Una misura chiave della robustezza di un codice è la distanza minima di Hamming, che, grosso modo, indica quante modifiche un avversario o un canale rumoroso dovrebbe effettuare per trasformare un messaggio valido in un altro. I codici che raggiungono la massima distanza conosciuta per la loro dimensione sono chiamati codici campioni. Trovarli è estremamente difficile: verificare esattamente un singolo codice candidato può richiedere una ricerca di forza bruta enorme che cresce in modo esplosivo con la dimensione del problema.

Lasciare che un modello intelligente indovini ciò che è difficile da calcolare

Gli autori si concentrano su una famiglia matematicamente ricca chiamata codici torici generalizzati, costruiti a partire da configurazioni di punti su una griglia. Invece di testare esaustivamente ogni possibilità, addestrano un trasformatore—un’architettura di rete neurale ampiamente usata nei modelli linguistici—a stimare la robustezza (distanza minima) di un codice direttamente dalle sue matrici definitorie. Utilizzando milioni di esempi su due sistemi numerici finiti, indicati come F7 e F8, il modello impara a predire le distanze con errori tipicamente entro tre unità dal valore reale, e con errori assoluti medi vicini a uno. Ciò è sufficientemente preciso per distinguere i candidati promettenti da quelli deboli senza eseguire ogni volta il lento algoritmo esatto.

Evoluzione nello spazio dei codici

Per trasformare queste previsioni rapide in nuove scoperte, il team abbina il trasformatore a un algoritmo genetico—un metodo di ottimizzazione ispirato all’evoluzione. Qui ogni individuo nella popolazione è un insieme di punti sulla griglia che definisce un codice. Le generazioni procedono selezionando gli individui migliori, ricombinando i loro insiemi di punti e talvolta mutandoli per esplorare nuove regioni. La fitness di un candidato si basa sulla distanza predetta dal modello, opportunamente modificata per preferire codici di una dimensione target e per evitare di riscoprire le stesse soluzioni. Solo quando la predizione suggerisce che un codice potrebbe essere eccezionale i ricercatori impiegano la pesante computazione necessaria per verificarne esattamente la distanza reale.

Figure 2
Figure 2.

Superare la ricerca casuale e trovare nuovi detentori di record

Applicata ai codici su F7, questa strategia combinata riscopre in modo affidabile i codici torici campioni che in passato avevano richiesto lavoro matematico e computazionale meticoloso. Ancora più impressionante, per il più complesso contesto F8—dove i metodi precedenti si erano bloccati perché lo spazio di ricerca è astronomicamente vasto—il metodo individua oltre 500 candidati campioni e conferma almeno sei codici inediti. Confrontando con una ricerca casuale, gli autori dimostrano che la loro strategia può ridurre circa della metà il numero di valutazioni esatte costose nei regimi più difficili, un risparmio significativo quando ogni verifica può essere molto onerosa.

Cosa significa per il futuro

Per un non specialista, la conclusione è che l’IA può guidarci attraverso immensità matematiche che altrimenti sarebbero fuori portata. Imparando il terreno approssimativo—dove è probabile trovare buoni codici—e orientando una ricerca evolutiva verso le regioni più promettenti, la combinazione trasformatore–algoritmo genetico trasforma un problema di forza bruta alla ricerca di un ago in un pagliaio in una caccia al tesoro più mirata. Gli autori prevedono che con dataset più grandi, modelli migliori e ulteriori ottimizzazioni, tecniche simili potrebbero accelerare la progettazione di molti tipi di codici di correzione degli errori, inclusi quelli per le reti di comunicazione future e perfino per i computer quantistici.

Citazione: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3

Parole chiave: codici di correzione degli errori, apprendimento automatico, algoritmi genetici, comunicazione digitale, teoria dei codici