Clear Sky Science · pt

Uma estrutura inovadora para transmissão segura de dados usando classificação por aprendizado de máquina e criptografia ElGamal com primos de Ramanujan

2026-02-26 · Voltar ao índice

Por que proteger mensagens do dia a dia importa

Todos os dias, bancos, hospitais e governos enviam mensagens digitais curtas que vão de alertas rotineiros a atualizações de conta altamente sensíveis. Tratar todas essas mensagens como igualmente secretas desperdiça poder de processamento, mas ser demasiado permissivo pode expor pessoas a fraudes e violações de privacidade. Este artigo explora uma forma de classificar automaticamente as mensagens segundo seu grau de sensibilidade e, em seguida, protegê-las com níveis de criptografia correspondentes, buscando equilibrar segurança, velocidade e uso de recursos.

Separando recados inofensivos de alertas críticos

Para começar, os autores constroem um sistema simples de classificação de texto que separa mensagens ordinárias, como manchetes gerais, daquelas altamente sensíveis, como notificações bancárias e alertas de transação. Eles criam um pequeno conjunto de dados com 200 frases curtas e cuidadosamente redigidas, metade financeiras e metade notícias gerais, e limpam o texto removendo pontuação, números e palavras de baixa importância (stop words). Cada mensagem é convertida em uma representação numérica usando uma técnica padrão que valoriza palavras frequentes em uma mensagem, mas raras no conjunto. Diversos métodos de aprendizado de máquina populares são testados, incluindo K-Nearest Neighbors, Support Vector Machines, Linear Discriminant Analysis e agrupamento K-means. Usando validação cruzada em cinco blocos para evitar sobreajuste, o modelo SVM (Support Vector Machine) entrega o desempenho mais preciso e estável, tornando-se a ferramenta preferida para decidir se uma mensagem é meramente rotineira ou verdadeiramente sensível.

Dois caminhos de criptografia para dois tipos de dados

Uma vez rotuladas, as mensagens seguem por um dos dois caminhos de criptografia. Mensagens de sensibilidade ordinária são protegidas usando o esquema padrão de chave pública ElGamal, um método bem conhecido que se apoia na dificuldade de um problema matemático chamado logaritmo discreto. Mensagens altamente sensíveis seguem uma rota modificada que é idêntica na forma como embaralha e desembaralha os dados, mas difere na escolha de um dos números secretos cruciais, conhecido como módulo primo. Aqui, os autores experimentam com uma família especial de números primos chamada primos de Ramanujan, que têm propriedades interessantes de espaçamento entre primos. Importante: os autores ressaltam que essa escolha não torna a matemática subjacente mais difícil de quebrar; em vez disso, oferece um modo estruturado e novo de gerar chaves sem alterar as bases de segurança comprovadas do ElGamal.

Verificando se nada foi alterado

Criptografia por si só não garante que uma mensagem não tenha sido modificada em trânsito. Para adicionar essa proteção, a estrutura anexa um código de autenticação de mensagem baseado em hash (HMAC) a toda mensagem criptografada antes do envio. Esse mecanismo usa um segredo compartilhado e uma função de hash unidirecional para produzir uma etiqueta compacta que muda mesmo que um único bit da mensagem seja alterado. No lado do receptor, o mesmo segredo e hash são usados para recalcular a etiqueta e compará-la com a enviada; somente se coincidirem a mensagem é aceita como autêntica. Os autores implementam todas as etapas — classificação, geração de chaves, criptografia, descriptografia e HMAC — dentro de um único programa em Python e avaliam quanto tempo cada operação leva e quanta informação pode ser processada por unidade de tempo.

O que os resultados de tempo revelam

Os testes de desempenho comparam o tratamento de mensagens de sensibilidade normal e alta, tanto com quanto sem a etapa adicional de HMAC. Como esperado, a adição da autenticação aumenta o tempo de processamento para todas as mensagens. Quando primos de Ramanujan são usados na rota de alta sensibilidade, a criptografia e a descriptografia dessas mensagens mostram taxa média de dados e throughput menores do que a rota ordinária, isto é, o sistema processa menos kilobytes por milissegundo e cada bit de dados leva mais tempo para ser tratado. Em termos leigos, a estrutura deliberadamente gasta mais tempo e esforço computacional no tráfego mais sensível, enquanto as mensagens menos críticas transitam com mais rapidez. Ao mesmo tempo, os autores observam que essa sobrecarga extra para dados críticos se traduz em menor uso de memória por unidade de dados, o que pode ajudar a manter a demanda por recursos administrável em servidores ocupados.

O que este trabalho significa para a comunicação segura

De forma simples, o estudo mostra que é possível projetar um sistema de segurança que avalia automaticamente a sensibilidade de uma mensagem, em seguida a encaminha por um nível de proteção correspondente, tudo isso preservando as garantias centrais de segurança de um método de criptografia confiável. O uso de primos de Ramanujan adiciona uma nuance matematicamente nova à forma como as chaves secretas são escolhidas, sem alegar fortalecer a segurança além do ElGamal padrão. Embora o classificador de texto seja apenas uma prova de conceito construída sobre um conjunto de dados pequeno e cuidadosamente selecionado, a arquitetura geral aponta para sistemas futuros nos quais mensagens cotidianas, alertas financeiros e atualizações médicas possam ser tratados de forma diferente, porém consistente, economizando recursos computacionais sem comprometer a privacidade e a integridade das informações que mais importam às pessoas.

Citação: Haritha, N., Narayanan, V. & Srikanth, R. An innovative framework for secure data transmission using machine learning based classification and ElGamal encryption with Ramanujan primes. Sci Rep 16, 11090 (2026). https://doi.org/10.1038/s41598-026-40797-9

Palavras-chave: transmissão segura de dados, classificação de texto, criptografia de chave pública, primos de Ramanujan, autenticação HMAC