Clear Sky Science · sv
Effektiv flerparts privat mängdunion motståndskraftig mot maximal sammansvärjningsattack
Varför det är viktigt att dela svarta listor utan att dela hemligheter
Många organisationer behöver samarbeta kring data utan att exponera de känsliga detaljerna bakom dem. Tänk på banker som vill slå ihop sina svartlistor över misstänkta konton, eller företag som vill kombinera bedrägerimarkörer, samtidigt som kundinformation och interna metoder hålls hemliga. Denna artikel undersöker hur flera parter kan beräkna unionen av sina privata listor — allt som förekommer i minst en lista — så att alla bara får veta den slutliga sammanslagna listan och inget annat om varandras data. Fokus ligger på att göra sådant samarbete både mycket säkert mot sammansvärjning och effektivt nog för mycket stora datamängder.

Att föra många privata listor samman
Uppgiften som studeras här kallas flerparts privat mängdunion. Varje deltagare innehar en konfidentiell samling objekt, såsom kontonummer eller identifierare, och de vill lära sig unionen av alla objekt över samtliga parter. Ingen ska få reda på vilken part som bidrog med vilket objekt, och ingen ska se något objekt som inte finns i den slutliga unionen. Befintliga metoder förlitar sig antingen på tung offentlig nyckelkryptografi eller generella ramverk för säker beräkning, vilka blir opraktiska när mängder innehåller miljontals poster eller när många parter deltar. Ett nyligen föreslaget protokoll av Gao och kollegor förbättrade skalbarheten och kunde motstå ”maximal sammansvärjning”, vilket innebär att det förblev säkert även om alla utom en deltagare samarbetade i hemlighet, men det krävde fortfarande överföring av enorma volymer tunga krypterade meddelanden.
Minska bandbreddskostnaden med en smartare kombination av verktyg
Författarna föreslår ett nytt protokoll som behåller Gao med flera:s starka motståndskraft mot sammansvärjning samtidigt som kommunikation kraftigt reduceras och körtiden förkortas. Deras huvudidé är att reservera dyr offentlig nyckelkryptering endast för de mest kritiska delarna — de objekt som måste förbli krypterade och senare gemensamt dekrypteras — medan lättare, snabbare symmetrisk kryptering används för majoriteten av mellanliggande data. De utformar ett tvåfasigt ”en-ledare”-protokoll där alla parter förbereder hash‑baserade datastrukturer över sina mängder och sedan interagerar så att endast en utsedd ledare slutligen lär sig unionen. En central byggsten, kallad batchad likhets‑testad obevakad slumpgenerering (batched equality‑tested oblivious random generation), tillåter två parter att generera matchande slumpmasker när deras dolda objekt är lika, utan att avslöja vilka objekt som matchade. Detta möjliggör effektiv, integritetsbevarande filtrering av dubbletter när informationen flyter genom protokollet.
Från en ensam ledare till ett mer rättvist delat resultat
I vissa samarbeten kan det vara riskabelt eller politiskt oacceptabelt att ha en enda ledare som ensam tar emot resultatet. Författarna utvidgar därför sin design till en ”ledarlös” version där varje part får unionen direkt. De behåller samma förberedande arbete men upprepar interaktionsfasen flera gånger och roterar vilken part som spelar ledarroll i varje körning. Varje runda producerar unionen för en annan deltagare, med gemensam dekryptering och omblandning så att ingen kan spåra objekt tillbaka till deras ursprungliga ägare. Denna ledarlösa design förbättrar robusthet och rättvisa — ingen enskild part kan hålla inne resultatet eller bli en flaskhals — på bekostnad av ytterligare kommunikation, som ungefär multipliceras med antalet parter.

Hur det nya protokollet skalas i verkligheten
Teamet implementerade sina protokoll och jämförde dem med den bästa tidigare metoden under en rad olika mängdstorlekar och antal deltagare. De realiserar komponenten för offentlig nyckel med tröskel‑ElGamal‑kryptering och använder befintliga bibliotek för hashing, likhetstester och grundläggande kryptografiska primitiv. Över realistiska parameterval minskar deras en‑ledare‑protokoll kommunikationsvolymen med ungefär fyra till fem gånger och snabbar upp körtiden med ungefär 1,3 till 1,8 gånger, beroende på antal parter och objekt. Det ledarlösa protokollet använder naturligtvis mer bandbredd, men drar ändå nytta av samma designförbättringar, och dess dekrypteringssteg kan överlappas så att totalt körtid ökar långsammare än kommunikationskostnaden.
Vad detta betyder för integritetsbevarande samarbete
För en icke‑specialist är slutsatsen att detta arbete gör det mer praktiskt för många oberoende organisationer att kombinera känsliga listor utan att avslöja sina rådata, även om nästan alla skulle konspirera. Genom att noggrant välja när tung kryptering behövs och när lättare metoder räcker, levererar författarna protokoll som är avsevärt mer sparsamma i bandbredd men ändå bibehåller starka säkerhetsgarantier. Deras ledarlösa variant tar dessutom bort beroendet av någon enskild part för att distribuera resultat. Tillsammans flyttar dessa framsteg integritetsbevarande datamängdunion från ett till stor del teoretiskt begrepp mot ett driftsdugligt verktyg för sektorer som finans, cybersäkerhet och dataanalys.
Citering: Liu, Q., Lee, JW. Efficient multi-party private set union resistant to maximum collusion attacks. Sci Rep 16, 13230 (2026). https://doi.org/10.1038/s41598-026-41069-2
Nyckelord: privat mängdunion, säker datakollaboration, flerpartsberäkning, integritetsbevarande kryptering, protokoll mot sammansvärjning