Clear Sky Science · zh
PrivEdge:一种用于边缘节点实时电力盗窃检测的混合拆分–联邦学习框架
让电力保持公平与诚信
电力盗窃可能听起来像是一个边缘的阴影事件,但它每年悄然从全球电力公司抽走多达1000亿美元,并且在某些电网中占据大量电力流失。那些丢失的收入最终会反映在更高的电费、更少的基础设施投资以及诚实用户面临的更不可靠供电上。与此同时,现代智能电表提供的细粒度数据虽然有助于抓住盗窃者,却也带来了棘手的消费者隐私问题。本文提出了PrivEdge,一种通过把智能推向靠近电表的小型设备来实时识别可疑用电模式的新方法,同时将大部分个人数据保留在家中附近以保护隐私。

监视每一瓦的麻烦
传统的电力盗窃侦测系统依赖于从数百万个电表收集大量原始使用数据并在中央数据中心分析所有信息。这种方法确实有效,但通信成本高,反应慢,并且会形成一笔诱人的详细家庭数据宝库,可能与严格的隐私法规相冲突。基于去中心化学习的新方法试图将数据保留在用户侧,仅共享模型更新。然而,许多此类方法仍然对小型设备提出过高计算需求、难以应对用电模式差异很大的用户,或只是在人为理想的实验室环境中测试,而非在混乱的真实世界条件下验证。
电表处更聪明的守门人
PrivEdge 采取了不同路径,将检测任务在一个低成本网关设备(在此实现为附着于每个智能电表的 Raspberry Pi 4)与中央服务器之间拆分。在网关上,轻量级软件会清理缺失读数、重新缩放数据、将其压缩为一组较小的特征,并使用一个紧凑的时间感知神经网络将最近的用电转换为一个简短的数值“指纹”。仅将这个紧凑的指纹(而非你烧水或开启空调时的原始细粒度轨迹)发送到下一环节。这大幅减少了必须传输的数据量,并有助于屏蔽原始数据中隐藏的日常生活模式。
在不分享秘密的情况下共同学习
在服务器端,这些指纹流入神经网络的更深部分和一组经典的机器学习模型,如决策树和支持向量分类器。它们的输出由一个简单的元模型组合,该元模型学习如何为每个模型分配权重,形成一个比任何单一检测器都更准确、更有弹性的集成。多个网关参与协调的训练过程:它们不是上传原始数据,而是定期发送模型更新,服务器将这些更新平均并返回,从而使整个系统能够同时从多个区域学习。作者在此过程中加入了实用的隐私保护层,包括更新的安全聚合、对共享信号的精心调节噪声注入,以及对于最高敏感部署可选的强加密。

为真实电网而非仅为实验室而建
为了验证该设计在理论之外是否可靠,研究者在来自中国国家电网的广泛使用的真实世界数据集上测试了 PrivEdge,该数据集包含来自数万名客户多年的标注正常和欺诈用电记录。他们在相同的预处理和硬件条件下,将其与领先的集中式、联邦式、拆分式和混合方法进行了比较。PrivEdge 达到了约98%的准确率和 F1 分数,优于所有竞争者,同时只发送紧凑的中间信息而非完整数据流。在 Raspberry Pi 网关上进行的长时间、带硬件环路的 24 小时运行显示出低且稳定的 CPU 占用、适度的功耗以及毫秒级的响应时间,即使在模拟网络延迟、数据包丢失和多个电表接入单个网关的情况下亦是如此。
在捕捉作弊的同时守护隐私
因为任何被共享的信号原则上都有可能泄露信息,作者进一步对自己的系统进行了现实的隐私和安全攻击演示。在“黑盒”测试中,攻击者只看到最终的盗窃评分——而非内部运作——试图推断谁出现在训练数据中或重建详细用电模式的尝试,其表现仅略好于随机猜测。当他们模拟故意通过伪造更新来毒化共享模型的客户端时,服务器上的鲁棒聚合方法在很大程度上抵消了该影响。总体来看,研究表明 PrivEdge 可以作为一个实用且注重隐私的监测工具:它帮助公用事业部门使用廉价的边缘硬件实时捕捉各种微妙和明显的盗窃行为,同时不会把智能电表变成无所不见的监控设备。
引用: Ramadan, A., Shouman, M.A., Attiya, G. et al. PrivEdge: a hybrid split–federated learning framework for real-time electricity theft detection on edge nodes. Sci Rep 16, 9685 (2026). https://doi.org/10.1038/s41598-026-39064-8
关键词: 电力盗窃, 智能电网, 边缘人工智能, 联邦学习, 保护隐私的分析