Clear Sky Science · nl

Een grafgebaseerde benchmarkdataset voor het partitioneren van printplaat-netlists

· Terug naar het overzicht

Waarom het opdelen van circuitontwerpen belangrijk is

Elk elektronisch apparaat dat je bezit, van je smartwatch tot je slimme koelkast, is afhankelijk van printplaten (PCBs) — die groene platen vol met kleine componenten en koperen sporen. Wanneer ingenieurs of veiligheidsanalisten moeten begrijpen hoe een bord werkt of het moeten controleren op verborgen kwetsbaarheden en manipulatie, moeten ze eerst een laag-niveau bedradingbeschrijving, een zogenaamde netlist, omzetten in zinvolle functionele blokken zoals voedingen, filters of communicatiemodules. Dit artikel introduceert BenchPCNP, de eerste grote, openbaar beschikbare benchmarkdataset die onderzoekers helpt moderne AI-methoden te trainen en te vergelijken om complexe PCB-netlists automatisch in zulke begrijpelijke modules te splitsen.

Figure 1
Figure 1.

Van rommelige bedradinglijsten naar betekenisvolle bouwblokken

Een PCB-netlist is in wezen een lange machineleesbare lijst die beschrijft welke componentpinnen met elkaar verbonden zijn. Op zichzelf is het alsof je elk kruispunt in een stad opschrijft, maar zonder wegenkaart. Netlist-partitionering pakt dit probleem aan door componenten te groeperen in functionele subcircuitten — waardoor die onhandelbare lijst verandert in herkenbare eenheden als “voeding”, “signaalfilter” of “LED-driver”. Dit is cruciaal in electronic design automation, waar ingenieurs tools willen die circuits snel kunnen herstructureren, debuggen of herontwerpen, en in reverse engineering, waar teams derdenborden moeten analyseren voor veiligheidscontroles en bescherming van intellectueel eigendom.

Waarom nieuwe data nodig is voor slimere tools

Recente vooruitgang in kunstmatige intelligentie, vooral in graph neural networks die zijn ontworpen om te redeneren over verbonden gegevens, belooft grote verbeteringen in hoe we circuits automatisch begrijpen. De voortgang is echter afgeremd door een gebrek aan hoogwaardige, gedeelde datasets met betrouwbare grondwaarheid-labels. Eerdere studies gebruikten kleine of privécollecties van PCB-netlists, wat het moeilijk maakte om methoden te vergelijken of resultaten te reproduceren. BenchPCNP sluit deze kloof door 50 echte, productgeverifieerde PCB-ontwerpen te verzamelen en zorgvuldig te labelen hoe elk circuit is verdeeld in functionele modules, waardoor een gemeenschappelijke testomgeving voor de gemeenschap ontstaat.

Hoe de dataset is opgebouwd uit ontwerpen uit de praktijk

De auteurs verkregen historische PCB-projecten van een professioneel ontwerpbureau, waardoor de circuits realistisch zijn en in de praktijk al hebben gewerkt. Voor elk ontwerp namen ze het master-netlistbestand in het standaard Protel 2-formaat en de bijbehorende sub-netlists die de door de ontwerper beoogde module-indeling weerspiegelen, gebaseerd op een industrienorm bekend als IPC-2612. Om commerciële geheimen te beschermen, werden schema-tekeningen verwijderd, maar de netlists — met componentnamen en elektrische verbindingen — werden behouden. Vijf ervaren ontwerpers controleerden alle bestanden en deelden vervolgens elk volledig circuit op in functionele modules, zoals voeding, filtering, LED-besturing en connectoren, en creëerden 54 verschillende modulecategorieën die weerspiegelen hoe ingenieurs bouwblokken hergebruiken in veel producten.

Circuits omzetten naar grafen voor machine learning

Om de data bruikbaar te maken voor AI-modellen, vertaalde het team elke netlist naar een graaf waarbij knopen componenten vertegenwoordigen en verbindingen elektrische connecties aangeven. Ze reduceerden elk component tot drie praktische attributen — wat voor soort onderdeel het is (bijvoorbeeld weerstand of chip), het behuizingstype en hoeveel pinnetjes het effectief heeft — en codeerden deze als eenvoudige numerieke kenmerken. Er werden twee complementaire weergaven van connectiviteit gemaakt. In de traditionele graafweergave zijn componenten paargewijs verbonden. In de hypergraafweergave kan een enkele “hyperedge” veel componenten koppelen die hetzelfde elektrische net delen, wat multi-way relaties directer vastlegt en redundante verbindingen vermindert. Beide weergaven worden geleverd in gestandaardiseerde JSON-bestanden, samen met scripts zodat andere onderzoekers de data kunnen reconstrueren of uitbreiden.

Figure 2
Figure 2.

Wat de benchmark onthult over slimere modellen

Met BenchPCNP testten de auteurs meerdere populaire graph neural networks en hun hypergraaf-gebaseerde tegenhangers op de taak om elk component aan de juiste module toe te wijzen. Ze ontdekten dat modellen die de hypergraafweergave gebruikten consequent hogere nauwkeurigheid en F1-scores behaalden dan modellen die alleen traditionele paargewijze grafen gebruikten, vooral bij groot gedeelde netwerken zoals voeding en aarde. De dataset toont ook realistische onbalansen: veelvoorkomende modules, zoals voedingen en filters, bevatten veel meer componenten dan zeldzame modules, zoals speciale seriële koppelingen of stroombegrenzers. Experimenten waarbij de hoeveelheid trainingsdata geleidelijk werd verhoogd lieten gestage prestatieverbeteringen zien, wat aangeeft dat BenchPCNP goed schaalt als testomgeving voor toekomstige, grotere studies.

Wat dit betekent voor toekomstige elektronica en beveiliging

In gewone bewoordingen biedt BenchPCNP onderzoekers een gedeelde, betrouwbare “verzameling kaarten” van echte circuitsteden, met duidelijke buurtlabels, zodat nieuwe AI-tools kunnen leren printplaten betrouwbaarder te lezen en te reconstrueren. Door aan te tonen dat hypergraafgebaseerde modellen de werkelijke structuur van circuitverbindingen beter vastleggen, wijst dit werk ontwikkelaars naar nauwkeurigere en efficiëntere methoden voor automatische moduleontdekking. Op de lange termijn zou deze benchmark de ontwikkeling van slimme ontwerphulpmiddelen en krachtigere reverse-engineeringinstrumenten moeten versnellen, wat ingenieurs helpt veiligere elektronica te bouwen en verborgen problemen in de hardware die ons moderne leven ondersteunt te detecteren.

Bronvermelding: Yang, J., Qiao, K., Chen, J. et al. A Graph-based Benchmark dataset for Printed Circuit Netlist Partitioning. Sci Data 13, 522 (2026). https://doi.org/10.1038/s41597-026-06818-y

Trefwoorden: printplaten, graph neural networks, netlist-partitionering, hypergraafmodellering, hardwarebeveiliging