Clear Sky Science · nl

Benchmarking van de MedMNIST-dataset op echte quantumhardware

· Terug naar het overzicht

Waarom quantumcomputers geven om medische afbeeldingen

Ziekenhuizen genereren enorme verzamelingen medische beelden—röntgenfoto’s, scans en microscoopsneden—die artsen steeds vaker door kunstmatige intelligentie laten analyseren. Deze studie stelt een gedurfde vraag: kunnen de vroege quantumcomputers van vandaag dat werk al deels overnemen? De auteurs voeren een grote, gevarieerde set medische beelden door echte IBM-quantumhardware om te onderzoeken hoe ver quantum machine learning nu al komt en waar het nog tekortschiet.

Figure 1
Figure 1.

Quantumchips leren medische patronen te zien

De onderzoekers richten zich op quantum machine learning, waarbij informatie wordt verwerkt met quantumbits die tegelijk in meerdere toestanden kunnen bestaan en elkaar op manieren kunnen beïnvloeden die gewone bits niet kunnen. In plaats van quantumcomponenten te combineren met vertrouwde diepe neurale netwerken, gebruiken ze opzettelijk uitsluitend quantummodellen om hun op zichzelf staande mogelijkheden te testen. Als testset nemen ze MedMNIST, een gestandaardiseerde verzameling lichtgewicht medische beelddatasets die röntgenfoto’s van de borstkas, netvliesbeelden, huidaandoeningen, bloedcellen, colonweefsel en abdominale CT-sneden bestrijkt. Elke dataset stelt een andere classificatietaak, van eenvoudige ja/nee-vragen (zoals wel of geen longontsteking) tot moeilijkere meercategorieproblemen met veel klassen en sterk onevenwichtige labelverdelingen.

Grote beelden persen in kleine quantumapparaten

Aangezien huidige quantumprocessors klein en ruisgevoelig zijn, kan het team geen volledige klinische beelden direct in de quantumcircuits invoeren. In plaats daarvan verkleinen ze elk beeld tot een grof raster—ofwel 7×7 of 8×8 pixels—met average pooling, en vertalen daarna elke pixel naar een rotatie die op een qubit wordt toegepast. Dit creëert een compacte quantumrepresentatie van het beeld waarmee het circuit kan werken. Om zoveel mogelijk uit de beperkte hardware te halen, genereren ze "device-aware" circuits met een geautomatiseerd ontwerptool genaamd Élivágar. Dat samplet vele kandidaatcircuitontwerpen die rekening houden met de werkelijke bedrading en foutkarakteristieken van IBM’s 127-qubit Cleveland-processor, beoordeelt ze op zowel ruisbestendigheid als vermogen om beeldklassen te scheiden, en selecteert de meest veelbelovende lay-outs voor verder testen.

In silico trainen, testen op een echte quantumchip

De quantummodellen worden eerst getraind in een geluidloze softwaresimulator die draait op krachtige klassieke GPU’s. Hier worden de parameters van de rotatiepoorten van het circuit afgesteld met standaard optimalisatiemethoden totdat het gesimuleerde circuit de trainingsbeelden het beste onderscheidt. Zodra goede parameterinstellingen zijn gevonden, bevriezen ze die en verplaatsen ze alleen de inference-stap naar het echte IBM-apparaat. Op de hardware brengen ze geavanceerde foutafhandelingsstrategieën in: patronen van extra pulsen bedoeld om rustende qubits tegen de omgeving te beschermen, randomisatietrucs om coherente fouten uit te middelen, en een meetopschoontechniek die uitleesfouten statistisch corrigeert. Een ablatiestudie op een van de meest ruisgevoelige datasets laat zien dat het combineren van alle drie de strategieën duidelijk verloren nauwkeurigheid en klasseonderscheid herwint vergeleken met het draaien van hetzelfde circuit zonder beschermingen op het apparaat.

Figure 2
Figure 2.

Hoe quantummodellen zich verhouden tot klassieke AI

Over acht MedMNIST-datasets behalen de volledig quantummodellen stevige prestaties ondanks dat ze drastisch minder features en parameters gebruiken dan de meest geavanceerde diepe netwerken. Bij röntgenfoto’s van de borstkas voor longontstekingdetectie bereikt het quantummodel bijvoorbeeld ongeveer 85% nauwkeurigheid—wat in wezen overeenkomt met populaire residual networks die werken op veel hogere resoluties met miljoenen aanpasbare gewichten. Voor complexere meerklassige problemen zoals netvliesaandoeningen en classificatie van huidaandoeningen blijven de quantummodellen achter bij de sterkste klassieke systemen, maar ze blijven verrassend concurrerend. Vergeleken met lichtgewicht klassieke methoden die op dezelfde laagresolutie-invoer zijn getraind, bereiken de quantumcircuits vergelijkbare nauwkeurigheid met veel minder afstelbare parameters, wat wijst op een gunstige "nauwkeurigheid per parameter"-afweging voor quantumontwerpen.

Wat dit betekent voor toekomstige medische AI

Voor een niet-specialistische lezer is de kernboodschap dat quantumcomputers, zelfs in hun rumoerige, kleinschalige jeugd, al realistische benchmarks voor medische beeldvorming op een betekenisvolle manier kunnen aanpakken—hoewel ze de beste klassieke AI nog niet verslaan. Dit werk stelt een zorgvuldige, appels-met-appels benchmark vast: een familie van uitsluitend quantummodellen, getraind in simulatie en uitgevoerd op een 127-qubit apparaat, geëvalueerd over veel verschillende medische beeldtypen en rigoureus vergeleken met gevestigde klassieke benaderingen. De resultaten tonen aan dat quantummodellen dicht bij klassieke prestaties kunnen komen terwijl ze veel minder informatie per beeld gebruiken, en dat slim circuitontwerp plus foutafhandelingsmethoden cruciaal zijn. Naarmate quantumhardware groter en schoner wordt, zouden deze ideeën kunnen helpen medische beeldanalyse in een regime te duwen waar quantumprocessors niet alleen gelijkheid bereiken, maar echte voordelen bieden ten opzichte van de huidige AI-tools.

Bronvermelding: Singh, G., Jin, H. & Merz Jr., K.M. Benchmarking MedMNIST dataset on real quantum hardware. Sci Rep 16, 9017 (2026). https://doi.org/10.1038/s41598-026-35605-3

Trefwoorden: quantum machine learning, medische beeldvorming, MedMNIST, IBM quantum hardware, foutmitigatie