Clear Sky Science · es

El aprendizaje automático descubre nuevos códigos campeones

· Volver al índice

Por qué esto importa para tu vida digital

Cada foto que envías, película que transmites o señal enviada al espacio está silenciosamente protegida por códigos correctores de errores: trucos matemáticos que detectan y corrigen fallos en los datos. Mejorar estos códigos significa menos llamadas cortadas, internet más rápido, mensajes espaciales más fiables y mayor densidad de almacenamiento. Este artículo muestra cómo la inteligencia artificial moderna, la misma tecnología detrás de los grandes modelos de lenguaje, puede ayudar a descubrir “códigos campeones” que baten récords y superan lo que antes habían encontrado los expertos humanos.

Figure 1
Figure 1.

Mantener los mensajes a salvo del ruido

Cuando la información viaja —ya sea por Wi‑Fi, cables submarinos o entre la Tierra y naves espaciales lejanas—puede ser distorsionada por el ruido. Los códigos correctores de errores protegen contra esto añadiendo bits extra cuidadosamente diseñados para que los errores puedan detectarse y, a menudo, corregirse. Una medida clave de la solidez de un código se llama distancia mínima de Hamming, que, a grandes rasgos, indica cuántos cambios necesitaría hacer un adversario o un canal ruidoso para transformar un mensaje válido en otro. Los códigos que alcanzan la mayor distancia conocida para su tamaño se denominan códigos campeones. Encontrar esos campeones es terriblemente difícil: comprobar exactamente un único código candidato puede requerir una búsqueda de fuerza bruta enorme que crece de forma explosiva con el tamaño del problema.

Dejar que un modelo inteligente estime lo que es difícil de calcular

Los autores se centran en una familia matemáticamente rica llamada códigos tóricos generalizados, que se construyen a partir de patrones de puntos en una cuadrícula. En lugar de probar exhaustivamente todas las posibilidades, entrenan un transformador —una arquitectura de red neuronal ampliamente usada en modelos de lenguaje— para estimar la fortaleza (distancia mínima) de un código directamente a partir de sus matrices definitorias. Usando millones de ejemplos sobre dos sistemas finitos de números etiquetados F7 y F8, el modelo aprende a predecir distancias con errores típicos dentro de tres unidades respecto al valor real, y con errores absolutos medios cercanos a uno. Eso es lo bastante preciso para distinguir candidatos prometedores de los débiles sin ejecutar cada vez el lento algoritmo exacto.

Evolución en el espacio de los códigos

Para convertir estas predicciones rápidas en nuevos descubrimientos, el equipo acopla el transformador con un algoritmo genético —un método de optimización inspirado en la evolución. Aquí, cada individuo de la población es un conjunto de puntos de la cuadrícula que define un código. Las generaciones avanzan seleccionando los individuos mejores, recombinando sus conjuntos de puntos y, ocasionalmente, mutándolos para explorar nuevas regiones. La aptitud de un candidato se basa en la distancia predicha por el modelo, ajustada para preferir códigos de un tamaño objetivo y evitar redescubrir las mismas soluciones. Solo cuando la predicción sugiere que un código podría ser excepcional los investigadores emplean la costosa computación necesaria para verificar exactamente su distancia verdadera.

Figure 2
Figure 2.

Superando la búsqueda aleatoria y encontrando nuevos récords

Aplicado a códigos sobre F7, este enfoque combinado redescubre de forma fiable códigos tóricos campeones que antes requerían un trabajo matemático y computacional laborioso. Más impresionante aún, en el escenario más complejo F8 —donde métodos anteriores se estancaron porque el espacio de búsqueda es astronómicamente grande— el método descubre más de 500 candidatos campeones y confirma al menos seis que eran desconocidos hasta entonces. Comparando con una búsqueda aleatoria, los autores muestran que su estrategia puede reducir a la mitad aproximadamente el número de evaluaciones exactas costosas en los regímenes más difíciles, un ahorro significativo cuando cada comprobación puede ser muy cara.

Qué significa esto de cara al futuro

Para un no especialista, la conclusión es que la IA puede guiarnos a través de inmensos paisajes matemáticos que de otro modo estarían fuera de nuestro alcance. Aprendiendo el terreno aproximado —dónde es probable que estén los buenos códigos— y dirigiendo una búsqueda evolutiva hacia las regiones más prometedoras, la combinación transformador–algoritmo genético convierte un problema de aguja en pajar por fuerza bruta en una búsqueda del tesoro más enfocada. Los autores esperan que con conjuntos de datos mayores, modelos mejores y ajustes adicionales, técnicas similares puedan acelerar el diseño de muchos tipos de códigos correctores de errores, incluidos los de redes de comunicación futuras e incluso de ordenadores cuánticos.

Cita: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3

Palabras clave: códigos correctores de errores, aprendizaje automático, algoritmos genéticos, comunicación digital, teoría de codificación