Clear Sky Science · pl

Uczenie maszynowe odkrywa nowe rekordowe kody

· Powrót do spisu

Dlaczego to ma znaczenie dla twojego życia cyfrowego

Każde zdjęcie, które wysyłasz, każdy film, który streamujesz, czy sygnał wysłany przez przestrzeń jest dyskretnie chroniony przez kody korekcyjne błędów — matematyczne sztuczki, które wykrywają i naprawiają zakłócenia w danych. Poprawa tych kodów oznacza mniej zerwanych połączeń, szybszy internet, bardziej niezawodne wiadomości z dalekiej przestrzeni kosmicznej i gęstsze przechowywanie danych. Artykuł pokazuje, jak nowoczesna sztuczna inteligencja — ta sama klasa technologii stojąca za dużymi modelami językowymi — może pomóc odkrywać rekordowe „mistrzowskie” kody, które przewyższają to, co dotąd znaleźli eksperci.

Figure 1
Figure 1.

Chronienie wiadomości przed szumem

Gdy informacja podróżuje — czy to przez Wi‑Fi, kable podmorskie, czy między Ziemią a odległymi sondami — może zostać zniekształcona przez szum. Kody korekcyjne błędów chronią przed tym, dodając starannie zaprojektowane dodatkowe bity, dzięki czemu błędy można wykryć i często naprawić. Kluczową miarą siły kodu jest tzw. minimalna odległość Hamminga, która, mówiąc ogólnie, informuje, ile zmian musiałby wprowadzić przeciwnik lub kanał z szumem, aby przemienić jedną prawidłową wiadomość w inną. Kody osiągające największą znaną odległość dla danego rozmiaru nazywane są kodami mistrzowskimi. Znalezienie takich mistrzów jest niezwykle trudne: dokładne sprawdzenie pojedynczego kandydata może wymagać ogromnego, brutalnego przeszukiwania, które eksploduje wraz ze wzrostem rozmiaru problemu.

Pozwolić inteligentnemu modelowi zgadywać to, co trudne do obliczenia

Autorzy skupiają się na matematycznie bogatej rodzinie zwanej uogólnionymi kodami toroidalnymi, które buduje się z wzorców punktów na siatce. Zamiast wyczerpująco testować każdą możliwość, trenują transformera — architekturę sieci neuronowej powszechnie używaną w modelach językowych — aby oszacować siłę (minimalną odległość) kodu bezpośrednio na podstawie jego definiujących macierzy. Korzystając z milionów przykładów nadanych nad dwoma skończonymi ciałami liczb, oznaczonymi F7 i F8, model uczy się przewidywać odległości z błędami zwykle w granicach trzech jednostek od wartości rzeczywistej, a średni błąd bezwzględny jest bliski jedności. To wystarczająco dokładne, by odróżnić obiecujące kandydatury od słabych bez uruchamiania powolnego, dokładnego algorytmu za każdym razem.

Ewolucja w przestrzeni kodów

Aby przekształcić te szybkie przewidywania w nowe odkrycia, zespół łączy transformera z algorytmem genetycznym — metodą optymalizacji inspirowaną ewolucją. Każdy osobnik w populacji to zestaw punktów na siatce definiujący kod. Pokolenia postępują poprzez selekcję lepszych osobników, rekombinację ich zbiorów punktów i okazjonalne mutacje, które eksplorują nowe rejony przestrzeni rozwiązań. Przystosowanie kandydata (fitness) opiera się na przewidywanej przez model odległości, z korektami faworyzującymi kody o docelowym rozmiarze i zapobiegającymi odkrywaniu tych samych rozwiązań. Dopiero gdy przewidywanie sugeruje, że kod może być wybitny, badacze ponoszą koszt ciężkich obliczeń potrzebnych do dokładnego zweryfikowania jego prawdziwej odległości.

Figure 2
Figure 2.

Pokonując losowe przeszukiwanie i znajdując nowych rekordzistów

Zastosowane do kodów nad F7, to połączenie niezawodnie odtwarzało mistrzowskie kody toroidalne, które wcześniej wymagały mozolnej pracy matematycznej i obliczeniowej. Jeszcze bardziej imponujące jest to, że w bardziej złożonym środowisku F8 — gdzie wcześniejsze metody ugrzęzły z powodu astronomicznie ogromnej przestrzeni poszukiwań — metoda odkryła ponad 500 kandydatów na mistrzowskie kody i potwierdziła co najmniej sześć wcześniej nieznanych. Porównując z przeszukiwaniem losowym, autorzy pokazują, że ich strategia może zmniejszyć liczbę kosztownych, dokładnych ewaluacji niemal o połowę w najtrudniejszych przypadkach, co stanowi istotną oszczędność, gdy każde sprawdzenie może być bardzo drogie.

Co to oznacza na przyszłość

Dla osoby spoza specjalności sedno jest takie, że AI może prowadzić nas przez ogromne matematyczne krajobrazy, które inaczej byłyby poza zasięgiem. Ucząc się przybliżonego terenu — gdzie prawdopodobnie znajdują się dobre kody — i kierując ewolucyjne poszukiwania ku najbardziej obiecującym rejonom, tandem transformera i algorytmu genetycznego zmienia problem brutalnego przeszukiwania igły w stogu siana w bardziej ukierunkowane poszukiwanie skarbów. Autorzy spodziewają się, że przy większych zbiorach danych, lepszych modelach i dalszym dostrojeniu podobne techniki mogą przyspieszyć projektowanie wielu rodzajów kodów korekcyjnych, w tym tych dla przyszłych sieci komunikacyjnych, a nawet komputerów kwantowych.

Cytowanie: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3

Słowa kluczowe: kody korekcyjne błędów, uczenie maszynowe, algorytmy genetyczne, komunikacja cyfrowa, teoria kodowania