Clear Sky Science · nl
Een innovatief kader voor veilige gegevensoverdracht met machine learning-classificatie en ElGamal-versleuteling met Ramanujan-priemgetallen
Waarom het beschermen van alledaagse berichten ertoe doet
Dagelijks versturen banken, ziekenhuizen en overheden korte digitale berichten die variëren van routinematige nieuwsberichten tot hoogst gevoelige rekeningupdates. Allemaal als even geheim behandelen is verspilling van rekenkracht, maar te relaxed zijn kan mensen blootstellen aan fraude en privacyschendingen. Dit artikel onderzoekt een manier om automatisch berichten te sorteren op gevoeligheid en ze vervolgens met overeenkomende niveaus van versleuteling te beveiligen, met als doel veiligheid in balans te brengen met snelheid en resourcegebruik.
Onschuldige notities scheiden van kritieke meldingen
Om te beginnen bouwen de auteurs een eenvoudig tekstclassificatiesysteem dat gewone berichten, zoals algemene nieuwsheadlines, scheidt van sterk gevoelige berichten, zoals bankmeldingen en transactiewaarschuwingen. Ze creëren een kleine dataset van 200 korte, zorgvuldig geformuleerde zinnen, de helft financieel en de helft algemeen nieuws, en schonen de tekst door punctuation, cijfers en veelvoorkomende stopwoorden te verwijderen. Elk bericht wordt omgezet in een numerieke vingerafdruk met een standaardtechniek die woorden benadrukt die vaak in één bericht voorkomen maar zelden in het geheel. Diverse gangbare machine-learningmethoden worden getest, waaronder K-Nearest Neighbors, Support Vector Machines, Linear Discriminant Analysis en K-means clustering. Met vijfvoudige cross-validatie om overfitting te voorkomen levert het Support Vector Machine-model de meest nauwkeurige en stabiele prestaties, waardoor het het voorkeursinstrument wordt om te bepalen of een bericht routinematig of echt gevoelig is.
Twee versleutelingsroutes voor twee typen gegevens
Zodra berichten zijn gelabeld, gaan ze één van twee versleutelingspaden in. Gewoonlijk gevoelige berichten worden beschermd met het standaard ElGamal-public-key-systeem, een bekende methode die berust op de moeilijkheid van een wiskundig probleem dat het discrete logaritmeprobleem wordt genoemd. Hoogst gevoelige berichten volgen een aangepaste route die identiek is in hoe gegevens worden versleuteld en ontsleuteld, maar verschilt in de keuze van een van de cruciale geheime getallen, de priemmodulus. Hier experimenteren de auteurs met een speciale familie priemgetallen die Ramanujan-priemgetallen genoemd wordt, die interessante afstandskenmerken tussen priemgetallen bezit. Belangrijk is dat de auteurs benadrukken dat deze keuze de onderliggende wiskunde niet moeilijker maakt om te kraken; het biedt in plaats daarvan een gestructureerde en nieuwe manier om sleutels te genereren zonder de bewezen veiligheidsfundamenten van ElGamal te wijzigen.

Controleren dat er niets is gemanipuleerd
Alleen versleuteling garandeert niet dat een bericht onderweg niet is gewijzigd. Om deze bescherming toe te voegen, voegt het kader een hash-based message authentication code (HMAC) toe aan elk versleuteld bericht voordat het wordt verzonden. Dit mechanisme gebruikt een gedeeld geheim en een eenrichtings-hashfunctie om een compact label te produceren dat verandert als zelfs één bit van het bericht wordt aangepast. Aan de ontvangende kant worden hetzelfde geheim en dezelfde hash gebruikt om het label opnieuw te berekenen en te vergelijken met het verzonden label; alleen als ze overeenkomen wordt het bericht als authentiek geaccepteerd. De auteurs implementeren alle stappen — classificatie, sleutelgeneratie, versleuteling, ontsleuteling en HMAC — binnen één Python-programma en evalueren hoe lang elke operatie duurt en hoeveel data per tijdseenheid verwerkt kan worden.
Wat de timingresultaten aantonen
Prestatietests vergelijken de behandeling van normaal gevoelige en hoogst gevoelige berichten, zowel met als zonder de extra HMAC-stap. Zoals verwacht verhoogt het toevoegen van authenticatie de verwerkingstijd voor alle berichten. Wanneer Ramanujan-priemgetallen worden gebruikt voor de hoogst gevoelige route, vertonen de versleuteling en ontsleuteling van die berichten een lagere gemiddelde datasnelheid en doorvoer dan de gewone route, wat betekent dat het systeem minder kilobytes per milliseconde verwerkt en elk bit data langer nodig heeft om te verwerken. Vanuit een niet-technisch perspectief besteedt het kader bewust meer tijd en rekeninspanningen aan het meest gevoelige verkeer, terwijl minder kritische berichten sneller worden afgehandeld. Tegelijk merken de auteurs op dat deze extra overhead voor kritieke data resulteert in een lager geheugengebruik per data-eenheid, wat kan helpen om ressources beheersbaar te houden op drukke servers.

Wat dit werk betekent voor veilige communicatie
In eenvoudige bewoordingen laat de studie zien dat het mogelijk is een beveiligingssysteem te ontwerpen dat automatisch inschat hoe gevoelig een bericht is en het vervolgens via een passend beschermingsniveau routeert, terwijl de kernveiligheidsgaranties van een vertrouwde versleutelingsmethode behouden blijven. Het gebruik van Ramanujan-priemgetallen voegt een wiskundig nieuw element toe aan de manier waarop geheime sleutels worden gekozen, zonder te beweren de veiligheid boven die van standaard ElGamal te versterken. Hoewel de tekstclassifier slechts een proof of concept is, gebouwd op een kleine, zorgvuldig samengestelde dataset, wijst de algemene architectuur op toekomstige systemen waarin alledaagse berichten, financiële waarschuwingen en medische updates verschillend maar consistent kunnen worden behandeld, waardoor rekenmiddelen worden bespaard zonder afbreuk te doen aan de privacy en integriteit van de informatie die mensen het meest dierbaar is.
Bronvermelding: Haritha, N., Narayanan, V. & Srikanth, R. An innovative framework for secure data transmission using machine learning based classification and ElGamal encryption with Ramanujan primes. Sci Rep 16, 11090 (2026). https://doi.org/10.1038/s41598-026-40797-9
Trefwoorden: veilige gegevensoverdracht, tekstclassificatie, publieke-sleutelversleuteling, Ramanujan-priemgetallen, HMAC-authenticatie