Clear Sky Science · fr
L'apprentissage automatique découvre de nouveaux codes champions
Pourquoi c'est important pour votre vie numérique
Chaque photo que vous envoyez, chaque film que vous diffusez ou chaque signal envoyé dans l'espace est discrètement protégé par des codes correcteurs d'erreurs — des astuces mathématiques qui détectent et corrigent les corruptions de données. Améliorer ces codes signifie moins d'appels coupés, un internet plus rapide, des messages spatiaux plus fiables et des stockages de données plus denses. Cet article montre comment l'intelligence artificielle moderne, la même famille de technologies qui sous-tend les grands modèles de langage, peut aider à découvrir des codes « champions » record qui surpassent ceux trouvés auparavant par des experts humains.

Protéger les messages du bruit
Quand l'information circule — que ce soit via le Wi‑Fi, les câbles sous-marins ou entre la Terre et des engins spatiaux lointains — elle peut être déformée par le bruit. Les codes correcteurs d'erreurs protègent contre cela en ajoutant des bits supplémentaires conçus avec soin pour que les erreurs puissent être détectées et souvent réparées. Une mesure cruciale de la robustesse d'un code est la distance de Hamming minimale, qui, en termes généraux, indique combien de modifications un canal bruyant devrait effectuer pour transformer un message valide en un autre. Les codes qui atteignent la plus grande distance connue pour leur taille sont qualifiés de codes champions. Trouver de tels champions est extrêmement difficile : vérifier exactement un seul code candidat peut exiger une recherche exhaustive colossale qui croît de manière explosive avec la taille du problème.
Laisser un modèle intelligent deviner ce qui est coûteux à calculer
Les auteurs se concentrent sur une famille mathématiquement riche appelée codes toriques généralisés, construits à partir de motifs de points sur une grille. Plutôt que de tester exhaustivement toutes les possibilités, ils entraînent un transformeur — une architecture de réseau de neurones largement utilisée dans les modèles de langage — pour estimer la robustesse (distance minimale) d'un code directement à partir de ses matrices définissantes. En utilisant des millions d'exemples sur deux corps finis, notés F7 et F8, le modèle apprend à prédire les distances avec des erreurs généralement inférieures à trois unités par rapport à la valeur réelle, et des erreurs absolues moyennes proches de un. Cela suffit à distinguer les candidats prometteurs des faibles sans lancer à chaque fois l'algorithme exact, lent et coûteux.
Évolution dans l'espace des codes
Pour transformer ces prédictions rapides en nouvelles découvertes, l'équipe couple le transformeur à un algorithme génétique — une méthode d'optimisation inspirée de l'évolution. Ici, chaque individu de la population est un ensemble de points sur la grille qui définit un code. Les générations avancent en sélectionnant les individus les meilleurs, en recombinent leurs ensembles de points et en mutent occasionnellement ces ensembles pour explorer de nouvelles régions. L'aptitude d'un candidat est basée sur la distance prédite par le modèle, ajustée pour favoriser les codes d'une taille cible et pour éviter de redécouvrir les mêmes solutions. Ce n'est que lorsque la prédiction suggère qu'un code pourrait être exceptionnel que les chercheurs engagent le lourd calcul nécessaire pour vérifier sa distance réelle de manière exacte.

Surpasser la recherche aléatoire et découvrir de nouveaux détenteurs de records
Appliquée aux codes sur F7, cette approche combinée redécouvre de façon fiable des codes toriques champions qui avaient auparavant exigé des travaux mathématiques et computationnels minutieux. Plus impressionnant encore, dans le cas plus complexe de F8 — où les méthodes antérieures butaient parce que l'espace de recherche est astronomiquement grand — la méthode met au jour plus de 500 candidats champions et confirme au moins six codes qui étaient auparavant inconnus. En comparant avec une recherche aléatoire, les auteurs montrent que leur stratégie peut réduire d'environ moitié le nombre d'évaluations exactes coûteuses dans les régimes les plus difficiles, une économie significative lorsque chaque vérification peut être très onéreuse.
Ce que cela implique pour l'avenir
Pour un non‑spécialiste, la leçon est que l'IA peut nous guider à travers d'immenses paysages mathématiques qui seraient autrement inaccessibles. En apprenant le relief approximatif — où les bons codes sont susceptibles de se trouver — et en orientant une recherche évolutionniste vers les régions les plus prometteuses, le duo transformeur–algorithme génétique transforme un problème de force brute cherchant une aiguille dans une botte de foin en une chasse au trésor plus ciblée. Les auteurs estiment qu'avec des jeux de données plus importants, de meilleurs modèles et un affinage supplémentaire, des techniques similaires pourraient accélérer la conception de nombreux types de codes correcteurs d'erreurs, y compris pour les réseaux de communication futurs et même les ordinateurs quantiques.
Citation: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3
Mots-clés: codes correcteurs d'erreurs, apprentissage automatique, algorithmes génétiques, communication numérique, théorie du codage