Clear Sky Science · zh
用于印刷电路网表划分的基于图的基准数据集
为什么把电路蓝图拆分很重要
你拥有的每一件电子设备,从智能手表到智能冰箱,都依赖于印刷电路板(PCB)——那些布满微小元件和铜导线的绿色板子。当工程师或安全分析师需要弄清一块电路板的工作原理,或检查其中是否存在隐蔽的脆弱点和篡改时,他们首先必须把一种底层的连线描述(称为网表)转化为有意义的功能模块,例如电源、滤波器或通信单元。本文提出了 BenchPCNP,这是第一个大型、公开可用的基准数据集,帮助研究人员训练并比较现代人工智能方法,以自动将复杂的 PCB 网表拆分成可理解的模块。

从混乱的连线清单到有意义的构建模块
PCB 网表本质上是一份机器可读的长清单,描述了哪些元件引脚彼此相连。单看网表,就像把一座城市所有的路口都记下来,但没有地图。网表划分通过将元件分组为功能子电路来解决这个问题——把那份难以处理的清单变成可识别的单元,如“电源输入”、“信号滤波”或“LED 驱动”。这在电子设计自动化中至关重要,工程师需要能快速重组、调试或重新设计电路的工具;在逆向工程中,团队必须分析第三方电路板以进行安全检查和知识产权保护。
为什么需要新数据来造就更智能的工具
近年来人工智能的进展,尤其是旨在推理互联数据的图神经网络,承诺能显著改进我们自动理解电路的能力。然而,缺乏高质量、具有可靠真实标签的共享数据集一直拖慢了进展。早期研究使用的是小型或私有的 PCB 网表集合,使得方法间的比较或结果复现变得困难。BenchPCNP 直接弥补了这一空白:它收集了 50 个真实的、经过生产验证的 PCB 设计,并对每个电路如何划分为功能模块进行了仔细标注,创建了一个供社区共同使用的测试平台。
如何从真实设计构建数据集
作者从一家专业设计公司获得了历史 PCB 项目,确保这些电路具有现实性并且已在实践中使用。对每个设计,他们获取了以标准 Protel 2 格式保存的主网表文件以及反映设计者意图模块划分的子网表,基于被称为 IPC-2612 的行业指南。为保护商业机密,原理图被移除,但包含元件名称和电气连接的网表被保留。五位经验丰富的设计师交叉核查所有文件,然后将每个完整电路划分为功能模块,例如电源、滤波、LED 控制和连接器,最终创建了 54 个独立的模块类别,这些类别反映了工程师在多种产品中重复使用构建模块的方式。
将电路转换为用于机器学习的图
为了让数据可被 AI 模型使用,团队将每个网表翻译为图:节点代表元件,边代表电气连接。他们将每个元件简化为三个实用属性——元件类型(例如电阻或芯片)、封装形式以及有效引脚数——并将这些属性编码为简单的数值特征。创建了两种互补的连接视图。在传统图视图中,元件以成对方式连接。在超图视图中,一个“超边”可以连接多个共享同一电网的元件,更直接地捕捉多方关系并减少冗余连接。两种视图都以标准化的 JSON 文件提供,并附带脚本,便于其他研究者重建或扩展数据。

基准对更智能模型的启示
利用 BenchPCNP,作者在将每个元件分配到其正确模块的任务上测试了若干流行的图神经网络及其基于超图的对应模型。他们发现,使用超图视图的模型在准确率和 F1 分数上始终优于仅使用传统成对图的模型,尤其是在存在像电源和接地这样的大型共享网络时。数据集还反映了真实的不平衡情况:常见模块(如电源和滤波器)包含的元件远多于罕见模块(如特殊串行链路或电流限制器)。在逐步增加训练数据量的实验中,性能稳步提升,表明 BenchPCNP 可作为未来更大规模研究的良好扩展测试床。
这对未来电子与安全的意义
通俗地说,BenchPCNP 为研究人员提供了一套共享且可信的“电路城市地图集”,并附有清晰的街区标签,使新一代 AI 工具能够更可靠地学习读取和重构 PCB。通过证明基于超图的模型能更好地捕捉电路连接的真实结构,这项工作为开发更精确且更高效的自动模块发现方法指明了方向。长期来看,该基准有望加速更智能的设计辅助工具和更强大的逆向工程工具的发展,帮助工程师构建更安全的电子产品并发现支撑现代生活的硬件中的潜在隐患。
引用: Yang, J., Qiao, K., Chen, J. et al. A Graph-based Benchmark dataset for Printed Circuit Netlist Partitioning. Sci Data 13, 522 (2026). https://doi.org/10.1038/s41597-026-06818-y
关键词: 印刷电路板, 图神经网络, 网表划分, 超图建模, 硬件安全