Clear Sky Science · de
Maschinelles Lernen entdeckt neue Champion-Codes
Warum das für Ihr digitales Leben wichtig ist
Jedes Foto, das Sie senden, jeder Film, den Sie streamen, und jedes Signal, das ins All gesendet wird, werden stillschweigend von fehlerkorrigierenden Codes geschützt – mathematischen Tricks, die Fehler in Daten erkennen und beheben. Bessere Codes bedeuten weniger Verbindungsabbrüche, schnelleres Internet, zuverlässigere Nachrichten aus dem tiefen Weltraum und dichtere Datenspeicherung. Diese Arbeit zeigt, wie moderne künstliche Intelligenz, dieselbe Technologie, die großen Sprachmodellen zugrunde liegt, helfen kann, rekordbrechende „Champion“-Codes zu entdecken, die das übertreffen, was menschliche Experten zuvor gefunden hatten.

Nachrichten gegen Rauschen schützen
Wenn Informationen unterwegs sind – sei es über WLAN, Seekabel oder zwischen der Erde und fernen Raumfahrzeugen – können sie durch Rauschen verfälscht werden. Fehlerkorrigierende Codes schützen davor, indem sie sorgfältig entworfene zusätzliche Bits hinzufügen, sodass Fehler erkannt und oft korrigiert werden können. Ein zentrales Maß für die Stärke eines Codes ist die minimale Hamming-Distanz, die vereinfacht gesagt angibt, wie viele Änderungen ein Störer oder ein verrauschter Kanal mindestens vornehmen müsste, um eine gültige Nachricht in eine andere zu verwandeln. Codes, die für ihre Größe die größtmögliche bekannte Distanz erreichen, werden Champion-Codes genannt. Solche Champions zu finden ist extrem schwierig: Die exakte Überprüfung eines einzelnen Kandidaten kann eine enorme bruteforceartige Suche erfordern, die mit der Problemgröße explosionsartig anwächst.
Ein intelligentes Modell raten lassen, was schwer zu berechnen ist
Die Autoren konzentrieren sich auf eine mathematisch reiche Familie, die verallgemeinerte torische Codes genannt wird und die aus Mustern von Punkten auf einem Gitter aufgebaut ist. Anstatt jede Möglichkeit exhaustiv zu testen, trainieren sie einen Transformer – eine in Sprachmodellen weit verbreitete neuronale Netzwerkarchitektur –, um die Stärke (minimale Distanz) eines Codes direkt aus seinen definierenden Matrizen abzuschätzen. Mit Millionen Beispielen über zwei endliche Zahlensysteme, bezeichnet F7 und F8, lernt das Modell, Distanzen mit typischen Abweichungen von etwa drei Einheiten gegenüber dem wahren Wert vorherzusagen, wobei die mittlere absolute Abweichung nahe eins liegt. Das ist genau genug, um vielversprechende Kandidaten von schwachen zu unterscheiden, ohne jedes Mal den langsamen exakten Algorithmus laufen zu lassen.
Evolution im Raum der Codes
Um diese schnellen Vorhersagen in neue Entdeckungen zu verwandeln, koppelt das Team den Transformer mit einem genetischen Algorithmus – einer auf Evolution basierenden Optimierungsmethode. Hier ist jedes Individuum in der Population eine Menge von Gitterpunkten, die einen Code definiert. Generationen schreiten voran, indem bessere Individuen ausgewählt, ihre Punktmengen rekombiniert und gelegentlich mutiert werden, um neue Regionen zu erkunden. Die Fitness eines Kandidaten basiert auf der vom Modell prognostizierten Distanz, mit einer leichten Bevorzugung für Codes einer Zielgröße und mit Mechanismen, die verhindern sollen, dass dieselben Lösungen wiederentdeckt werden. Nur wenn die Vorhersage auf einen besonders guten Code hindeutet, investieren die Forscher die aufwändige Rechnung, um dessen exakte Distanz zu verifizieren.

Random-Suche übertreffen und neue Rekordhalter finden
Auf Codes über F7 angewandt, findet dieser kombinierte Ansatz zuverlässig Champion-torische Codes wieder, die zuvor mühsame mathematische und rechnerische Arbeit erforderten. Noch beeindruckender ist das Ergebnis für den komplexeren F8-Fall – wo frühere Methoden ins Stocken gerieten, weil der Suchraum astronomisch groß ist –: Die Methode fördert über 500 Champion-Kandidaten zutage und bestätigt mindestens sechs zuvor unbekannte. Durch den Vergleich mit einer zufälligen Suche zeigen die Autoren, dass ihre Strategie die Anzahl teurer exakter Auswertungen in den härtesten Fällen etwa halbieren kann, was eine bedeutende Einsparung ist, wenn jede Prüfung sehr kostspielig sein kann.
Was das für die Zukunft bedeutet
Für Nicht‑Spezialisten ist die Erkenntnis: KI kann uns durch gewaltige mathematische Landschaften führen, die sonst unzugänglich wären. Indem sie das grobe Gelände – also die Regionen, in denen gute Codes wahrscheinlich sind – erlernt und eine evolutionäre Suche zu den vielversprechendsten Bereichen lenkt, verwandelt die Kombination aus Transformer und genetischem Algorithmus ein brutales Nadel-im-Heuhaufen-Problem in eine fokussiertere Schatzsuche. Die Autoren erwarten, dass mit größeren Datensätzen, besseren Modellen und weiterem Feintuning ähnliche Techniken die Entwicklung vieler Arten fehlerkorrigierender Codes beschleunigen könnten, einschließlich solcher für zukünftige Kommunikationsnetze und sogar Quantencomputer.
Zitation: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3
Schlüsselwörter: fehlerkorrigierende Codes, maschinelles Lernen, genetische Algorithmen, digitale Kommunikation, Coding-Theorie