Clear Sky Science · pl

Innowacyjny system bezpiecznej transmisji danych wykorzystujący klasyfikację opartą na uczeniu maszynowym i szyfrowanie ElGamal z użyciem liczb pierwszych Ramanujana

2026-02-26 · Powrót do spisu

Dlaczego warto chronić codzienne wiadomości

Codziennie banki, szpitale i instytucje rządowe wysyłają krótkie wiadomości cyfrowe, od rutynowych powiadomień po wysoce wrażliwe informacje o kontach. Traktowanie wszystkich tych komunikatów tak, jakby były jednakowo tajne, marnuje moc obliczeniową, natomiast zbyt pobłażliwe podejście może narazić osoby na oszustwa i naruszenia prywatności. W artykule opisano metodę automatycznego sortowania wiadomości według stopnia ich wrażliwości, a następnie zabezpieczania ich odpowiednim poziomem szyfrowania, dążąc do równowagi między bezpieczeństwem a szybkością i wykorzystaniem zasobów.

Oddzielanie niegroźnych notatek od krytycznych alertów

Na początek autorzy budują prosty system klasyfikacji tekstu, który rozdziela zwykłe komunikaty, takie jak ogólne nagłówki newsów, od informacji wysoce wrażliwych, jak powiadomienia bankowe i alerty transakcyjne. Tworzą mały zbiór danych z 200 krótkimi, starannie opracowanymi zdaniami — połowa finansowych, połowa ogólnych — i oczyszczają tekst, usuwając interpunkcję, cyfry oraz typowe słowa stop. Każdą wiadomość zamieniają w numeryczny odcisk przy użyciu standardowej techniki uwypuklającej słowa częste w danym komunikacie, lecz rzadkie ogólnie. Testują kilka popularnych metod uczenia maszynowego, w tym K-Nearest Neighbors, Support Vector Machines, Linear Discriminant Analysis i klasteryzację K-means. Z użyciem pięciokrotnej walidacji krzyżowej, aby uniknąć przeuczenia, model Support Vector Machine daje najbardziej trafne i stabilne wyniki, stając się preferowanym narzędziem do decydowania, czy wiadomość jest jedynie rutynowa, czy rzeczywiście wrażliwa.

Dwie ścieżki szyfrowania dla dwóch typów danych

Po sklasyfikowaniu wiadomości kierowane są jedną z dwóch ścieżek szyfrowania. Zwykłe wrażliwe komunikaty są chronione przy użyciu standardowego schematu klucza publicznego ElGamal, znanej metody opartej na trudności pewnego problemu matematycznego zwanego dyskretnym logarytmem. Wiadomości wysoce wrażliwe przechodzą zmodyfikowaną ścieżkę, która pod względem sposobu szyfrowania i odszyfrowywania jest identyczna, lecz różni się wyborem jednego z kluczowych sekretów, zwanego modułem pierwszym (prime modulus). Autorzy eksperymentują tutaj ze specjalną rodziną liczb pierwszych zwanych liczbami pierwszymi Ramanujana, które wyróżniają się ciekawymi właściwościami rozmieszczenia wśród liczb pierwszych. Ważne jest, że autorzy podkreślają — ten wybór nie czyni matematycznych podstaw trudniejszych do złamania; oferuje za to uporządkowany i nowatorski sposób generowania kluczy bez zmiany sprawdzonych podstaw bezpieczeństwa ElGamal.

Sprawdzanie, czy nic nie zostało zmienione

Same szyfrowanie nie gwarantuje, że wiadomość nie została zmodyfikowana w tranzycie. Aby dodać taką ochronę, system dopięty jest do każdej zaszyfrowanej wiadomości przez tag HMAC (hash-based message authentication code) przed jej wysłaniem. Mechanizm ten wykorzystuje współdzielony sekret i jednokierunkową funkcję skrótu do wygenerowania zwartego taga, który zmienia się nawet przy modyfikacji pojedynczego bitu wiadomości. Po stronie odbiorcy ten sam sekret i funkcja skrótu są używane do ponownego obliczenia taga i porównania go z przesłanym; tylko gdy się zgadzają, wiadomość jest uznawana za autentyczną. Autorzy implementują wszystkie kroki — klasyfikację, generowanie kluczy, szyfrowanie, odszyfrowywanie i HMAC — w jednym programie w Pythonie i mierzą czas trwania każdej operacji oraz ile danych można przetworzyć w jednostce czasu.

Co ujawniają wyniki pomiarów czasu

Testy wydajności porównują przetwarzanie zwykłych i wysoce wrażliwych wiadomości, zarówno z krokiem HMAC, jak i bez niego. Jak można się spodziewać, dodanie uwierzytelnienia zwiększa czas przetwarzania wszystkich wiadomości. Gdy w ścieżce dla wiadomości wysoce wrażliwych użyte są liczby pierwsze Ramanujana, szyfrowanie i odszyfrowywanie tych wiadomości wykazuje niższą średnią przepustowość i niższy wskaźnik danych niż w standardowej ścieżce, co oznacza, że system obsługuje mniej kilobajtów na milisekundę, a każdy bit danych zajmuje więcej czasu przetwarzania. Z perspektywy użytkownika, architektura świadomie poświęca więcej czasu i zasobów obliczeniowych na najbardziej wrażliwy ruch, podczas gdy mniej krytyczne wiadomości przepływają szybciej. Jednocześnie autorzy zauważają, że to dodatkowe obciążenie dla danych krytycznych przekłada się na niższe wykorzystanie pamięci na jednostkę danych, co może pomóc utrzymać zapotrzebowanie na zasoby w ryzach na obciążonych serwerach.

Co ta praca oznacza dla bezpiecznej komunikacji

Mówiąc prosto, badanie pokazuje, że można zaprojektować system bezpieczeństwa, który automatycznie ocenia, jak wrażliwa jest wiadomość, a następnie kieruje ją przez adekwatny poziom ochrony, przy jednoczesnym zachowaniu podstawowych gwarancji bezpieczeństwa zaufanej metody szyfrowania. Zastosowanie liczb pierwszych Ramanujana wnosi matematycznie nowatorski element do sposobu wyboru kluczy tajnych, nie twierdząc przy tym, że wzmacnia bezpieczeństwo ponad standardowy ElGamal. Choć klasyfikator tekstu jest jedynie dowodem koncepcji opartym na niewielkim, starannie dobranym zbiorze danych, ogólna architektura wskazuje kierunek dla przyszłych systemów, w których codzienne komunikaty, alerty finansowe i powiadomienia medyczne mogą być obsługiwane różnie, lecz spójnie, oszczędzając zasoby obliczeniowe bez kompromisu dla prywatności i integralności informacji, na których ludziom zależy najbardziej.

Cytowanie: Haritha, N., Narayanan, V. & Srikanth, R. An innovative framework for secure data transmission using machine learning based classification and ElGamal encryption with Ramanujan primes. Sci Rep 16, 11090 (2026). https://doi.org/10.1038/s41598-026-40797-9

Słowa kluczowe: bezpieczna transmisja danych, klasyfikacja tekstu, szyfrowanie klucza publicznego, liczby pierwsze Ramanujana, uwierzytelnianie HMAC