Clear Sky Science · pt

Aprendizado de máquina descobre novos códigos campeões

2026-03-25 · Voltar ao índice

Por que isso importa para sua vida digital

Cada foto que você envia, filme que você transmite ou sinal enviado pelo espaço é discretamente protegido por códigos de correção de erro — truques matemáticos que detectam e corrigem falhas nos dados. Tornar esses códigos ainda melhores significa menos chamadas perdidas, internet mais rápida, mensagens interplanetárias mais confiáveis e armazenamento de dados mais denso. Este artigo mostra como a inteligência artificial moderna, o mesmo tipo de tecnologia por trás de grandes modelos de linguagem, pode ajudar a descobrir “códigos campeões” recordistas que superam o que especialistas humanos haviam encontrado antes.

Protegendo mensagens contra o ruído

Quando a informação viaja — seja por Wi‑Fi, cabos submarinos ou entre a Terra e espaçonaves distantes — ela pode ser distorcida pelo ruído. Códigos de correção de erro protegem contra isso adicionando bits extras cuidadosamente projetados para que erros possam ser detectados e frequentemente reparados. Uma medida-chave da força de um código é chamada distância mínima de Hamming, que, em termos gerais, indica quantas alterações um adversário ou um canal ruidoso precisaria fazer para transformar uma mensagem válida em outra. Códigos que atingem a maior distância conhecida para seu tamanho são chamados de códigos campeões. Encontrar esses campeões é extremamente difícil: verificar exatamente um único código candidato pode exigir uma busca exaustiva enorme que cresce explosivamente com o tamanho do problema.

Deixando um modelo esperto adivinhar o que é difícil de calcular

Os autores concentram-se em uma família matematicamente rica chamada códigos toricos generalizados, que são construídos a partir de padrões de pontos em uma grade. Em vez de testar exaustivamente todas as possibilidades, eles treinam um transformer — uma arquitetura de rede neural amplamente usada em modelos de linguagem — para estimar a força (distância mínima) de um código diretamente a partir de suas matrizes definidoras. Usando milhões de exemplos sobre dois sistemas de números finitos, rotulados F7 e F8, o modelo aprende a prever distâncias com erros tipicamente dentro de três unidades do valor real, e com erros absolutos médios próximos de um. Isso é preciso o suficiente para separar candidatos promissores dos fracos sem rodar o lento algoritmo exato a cada vez.

Evolução no espaço dos códigos

Para transformar essas previsões rápidas em novas descobertas, a equipe acopla o transformer a um algoritmo genético — um método de otimização inspirado pela evolução. Aqui, cada indivíduo na população é um conjunto de pontos na grade que define um código. As gerações avançam selecionando indivíduos melhores, recombinando seus conjuntos de pontos e ocasionalmente os mutando para explorar novas regiões. A aptidão de um candidato é baseada na distância prevista pelo modelo, ajustada para preferir códigos de um tamanho alvo e evitar redescobrir as mesmas soluções. Somente quando a previsão sugere que um código pode ser excepcional é que os pesquisadores dedicam a pesada computação necessária para verificar sua distância verdadeira exatamente.

Superando a busca aleatória e encontrando novos recordistas

Aplicada a códigos sobre F7, essa abordagem combinada redescobre de forma confiável códigos toricos campeões que anteriormente exigiram trabalhos matemáticos e computacionais meticulosos. Mais impressionante, para o cenário mais complexo F8 — onde métodos anteriores travaram porque o espaço de busca é astronomicamente grande — o método descobriu mais de 500 candidatos campeões e confirmou pelo menos seis que eram desconhecidos até então. Ao comparar com uma busca aleatória, os autores mostram que sua estratégia pode reduzir o número de avaliações exatas dispendiosas aproximadamente pela metade nos regimes mais difíceis, uma economia significativa quando cada verificação pode ser muito custosa.

O que isso significa para o futuro

Para um não especialista, a conclusão é que a IA pode nos guiar por imensos territórios matemáticos que de outra forma seriam inacessíveis. Ao aprender o terreno grosseiro — onde códigos bons são mais prováveis de estar — e direcionar uma busca evolutiva para as regiões mais promissoras, a combinação transformer–algoritmo genético transforma um problema de agulha no palheiro por força bruta em uma caça ao tesouro mais focada. Os autores esperam que, com conjuntos de dados maiores, modelos melhores e mais ajustes, técnicas semelhantes possam acelerar o projeto de muitos tipos de códigos de correção de erro, incluindo os para redes de comunicação futuras e até computadores quânticos.

Citação: He, YH., Kasprzyk, A.M., Le, Q. et al. Machine learning discovers new champion codes. npj Artif. Intell. 2, 37 (2026). https://doi.org/10.1038/s44387-026-00077-3

Palavras-chave: códigos de correção de erro, aprendizado de máquina, algoritmos genéticos, comunicação digital, teoria da codificação