Clear Sky Science · pt

União privada eficiente entre múltiplas partes resistente a ataques de conluio máximo

· Voltar ao índice

Por que compartilhar listas negras sem revelar segredos é importante

Muitas organizações precisam colaborar em dados sem expor os detalhes sensíveis por trás deles. Pense em bancos que desejam consolidar suas listas negras de contas suspeitas, ou empresas que querem combinar indicadores de fraude, mantendo em segredo informações de clientes e métodos internos. Este artigo explora como várias partes podem calcular a união de suas listas privadas — tudo o que aparece em ao menos uma lista — de modo que todos aprendam apenas a lista combinada final, mas nada mais sobre os dados uns dos outros. O foco é tornar essa colaboração ao mesmo tempo altamente segura contra conluios e eficiente o suficiente para conjuntos de dados muito grandes.

Figure 1
Figure 1.

Reunindo muitas listas privadas

A tarefa estudada aqui é chamada união de conjuntos privados multipartidária. Cada participante possui uma coleção confidencial de itens, como números de conta ou identificadores, e quer aprender a união de todos os itens entre as partes. Ninguém deve descobrir qual parte contribuiu com qual item, nem ver qualquer item que não esteja na união final. Abordagens existentes dependem de criptografia de chave pública pesada ou de estruturas gerais de computação segura, que se tornam impraticáveis quando os conjuntos contêm milhões de entradas ou quando há muitas partes envolvidas. Um protocolo recente de Gao e colegas melhorou a escalabilidade e podia resistir ao “conluio máximo”, isto é, permanecia seguro mesmo se todos, exceto um participante, cooperassem secretamente, mas ainda exigia a transmissão de volumes enormes de mensagens cifradas volumosas.

Reduzindo a conta de banda com uma mistura mais inteligente de ferramentas

Os autores propõem um novo protocolo que mantém a forte resistência a conluios de Gao et al. enquanto reduz drasticamente a comunicação e acelera o tempo de execução. A ideia-chave é reservar a criptografia de chave pública cara apenas para as peças mais críticas — os itens que precisam permanecer criptografados e que serão depois decifrados em conjunto — enquanto usam criptografia simétrica mais leve e rápida para a maior parte dos dados intermediários. Eles projetam um protocolo de duas fases com “um líder”, no qual todas as partes preparam estruturas de dados baseadas em hash sobre seus conjuntos e então interagem de modo que apenas um líder designado aprenda por fim a união. Um bloco construtivo central, chamado geração aleatória oblíqua com teste de igualdade em lote, permite que duas partes gerem máscaras aleatórias correspondentes sempre que seus itens ocultos forem iguais, sem revelar quais itens coincidiram. Isso possibilita uma filtragem de duplicatas eficiente e preservadora de privacidade à medida que a informação flui pelo protocolo.

De um único líder para um resultado mais justo e compartilhado

Em algumas colaborações, ter um único líder que recebe sozinho o resultado pode ser arriscado ou politicamente inaceitável. Por isso os autores estendem o desenho para uma versão “sem líder” em que cada parte obtém a união diretamente. Mantêm o mesmo trabalho de preparação, mas repetem a fase de interação várias vezes, rotacionando qual parte desempenha o papel de líder em cada execução. Cada rodada produz a união para um participante diferente, usando decodificação conjunta e embaralhamento para que ninguém consiga rastrear itens até seus donos originais. Esse desenho sem líder melhora a robustez e a equidade — nenhuma parte única pode reter o resultado ou se tornar um gargalo — ao custo de comunicação adicional, que fica aproximadamente multiplicada pelo número de participantes.

Figure 2
Figure 2.

Como o novo protocolo escala no mundo real

A equipe implementou seus protocolos e os comparou com o melhor esquema anterior sob uma variedade de tamanhos de conjuntos e números de participantes. Eles instanciam o componente de chave pública com criptografia ElGamal threshold e utilizam bibliotecas existentes para hashing, testes de igualdade e primitivos criptográficos básicos. Em parâmetros realistas, seu protocolo com um líder reduz o volume de comunicação em cerca de quatro a cinco vezes e acelera o tempo de execução em cerca de 1,3 a 1,8 vezes, dependendo do número de partes e itens. O protocolo sem líder naturalmente usa mais largura de banda, mas ainda se beneficia das mesmas eficiências de projeto, e suas etapas de decodificação podem ser sobrepostas de modo que o tempo total de execução cresça mais lentamente que o custo de comunicação.

O que isso significa para a colaboração preservadora de privacidade

Para um não especialista, a conclusão é que este trabalho torna mais prático para muitas organizações independentes combinar listas sensíveis sem revelar seus dados brutos, mesmo que quase todas conspirassem. Ao escolher cuidadosamente quando usar criptografia pesada e quando métodos mais leves são suficientes, os autores entregam protocolos significativamente mais enxutos em largura de banda, mantendo fortes garantias de segurança. Sua variante sem líder remove ainda a dependência de qualquer parte única para distribuir resultados. Juntas, essas melhorias movem a união de dados preservadora de privacidade de um exercício majoritariamente teórico para uma ferramenta passível de implantação em setores como finanças, cibersegurança e análise de dados.

Citação: Liu, Q., Lee, JW. Efficient multi-party private set union resistant to maximum collusion attacks. Sci Rep 16, 13230 (2026). https://doi.org/10.1038/s41598-026-41069-2

Palavras-chave: união de conjuntos privados, colaboração de dados segura, computação multipartidária, criptografia preservadora de privacidade, protocolos resistentes a conluio