Clear Sky Science · ru
Машинное обучение обнаруживает новые рекордные коды
Почему это важно для вашей цифровой жизни
Каждое отправленное фото, транслируемый фильм или сигнал, посылаемый в космос, защищены кодами с исправлением ошибок — математическими приёмами, которые обнаруживают и исправляют искажения данных. Улучшение этих кодов означает меньше разорванных звонков, более быструю работу интернета, надёжную связь с далёкими космическими аппаратами и более плотное хранение информации. В этой статье показано, как современные методы искусственного интеллекта, те же, что лежат в основе крупных языковых моделей, помогают находить рекордные «чемпионские» коды, превосходящие результаты, ранее достигнутые экспертами.

Защита сообщений от помех
Когда информация передаётся — по Wi‑Fi, по океанским кабелям или между Землёй и отдалёнными космическими кораблями — она может искажаться из‑за шума. Коды с исправлением ошибок защищают от этого, добавляя специально подобранные дополнительные биты, чтобы ошибки можно было обнаружить и часто исправить. Ключевая мера надёжности кода называется минимальным расстоянием Хэмминга, которое, в общих чертах, показывает, сколько изменений потребуется внещнему воздействию или шуму, чтобы превратить одно допустимое сообщение в другое. Коды, достигающие наибольшего известного расстояния для данного размера, называют чемпионами. Нахождение таких чемпионов чрезвычайно сложно: точная проверка одного кандидата может потребовать огромного грубого перебора, который экспоненциально растёт с размером задачи.
Позволить умной модели угадывать то, что трудно вычислить
Авторы сосредотачиваются на математически богатом семействе, называемом обобщёнными торическими кодами, которые строятся на основе шаблонов точек на сетке. Вместо того чтобы исчерпывающе тестировать все варианты, они обучают трансформер — архитектуру нейронной сети, широко используемую в языковых моделях — оценивать прочность (минимальное расстояние) кода прямо по его задающим матрицам. На миллионах примеров над двумя конечными полями, отмеченных как F7 и F8, модель учится предсказывать расстояния с погрешностями обычно в пределах трёх единиц от истинного значения и со средней абсолютной ошибкой близкой к единице. Это достаточно точно, чтобы отличать многообещающие кандидаты от слабых, не прибегая каждый раз к медленному точному алгоритму.
Эволюция в пространстве кодов
Чтобы превратить эти быстрые предсказания в новые открытия, команда сочетает трансформер с генетическим алгоритмом — методом оптимизации, вдохновлённым эволюцией. Здесь каждый индивид в популяции представляет собой набор точек на сетке, определяющий код. Поколения развиваются путём отбора лучших особей, рекомбинации их наборов точек и периодических мутаций для исследования новых областей. Приспособленность кандидата основывается на предсказанном моделью расстоянии, с небольшим смещением в сторону кодов целевого размера и с учётом избегания повторного открытия тех же решений. Только когда предсказание указывает, что код может быть выдающимся, исследователи тратят ресурсоёмкую вычислительную работу, чтобы точно проверить его истинное расстояние.

Превосходство над случайным поиском и нахождение новых рекордсменов
Применённый к кодам над F7 этот комбинированный подход стабильно вновь находит чемпионские торические коды, для обнаружения которых ранее требовалась кропотливая математическая и вычислительная работа. Ещё более впечатляюще, в более сложной настройке F8 — где прежние методы заходили в тупик из‑за астрономически большого пространства поиска — метод обнаруживает более 500 кандидатов‑чемпионов и подтверждает по крайней мере шесть ранее неизвестных кодов. Сравнение со случайным поиском показывает, что их стратегия позволяет сократить число дорогостоящих точных проверок примерно вдвое в самых трудных режимах, что даёт существенную экономию, когда каждая проверка может быть очень затратной.
Что это означает в будущем
Для неспециалиста вывод таков: ИИ может направлять нас по огромным математическим ландшафтам, которые иначе были бы недоступны. Изучая грубую структуру местности — где, вероятно, находятся хорошие коды — и направляя эволюционный поиск в наиболее перспективные регионы, сочетание трансформера и генетического алгоритма превращает проблему «иглы в стоге сена» с грубым перебором в более сфокусированную охоту за сокровищами. Авторы ожидают, что с большими наборами данных, лучшими моделями и дополнительной настройкой подобные приёмы смогут ускорить проектирование многих типов кодов с исправлением ошибок, включая решения для будущих сетей связи и даже квантовых компьютеров.
Цитирование: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3
Ключевые слова: коды с исправлением ошибок, машинное обучение, генетические алгоритмы, цифровая связь, теория кодирования