Clear Sky Science · nl

Superieure weerbaarheid tegen vergiftiging en vatbaarheid voor ontleren in kwantum-machinelearning

· Terug naar het overzicht

Waarom het opruimen van slechte gegevens belangrijk is voor AI

Moderne kunstmatige-intelligentiesystemen leren van enorme verzamelingen voorbeelden, maar die voorbeelden zijn vaak onvolmaakt. Sommige zijn per ongeluk verkeerd gelabeld, andere kunnen opzettelijk zijn gemanipuleerd. Zodra zulke “vergiftigde” gegevens in de training sluipen, kunnen ze het gedrag van een model op schadelijke wijze vervormen. Dit artikel stelt een verrassende vraag: als we leersystemen bouwen op basis van kwantumcomputers in plaats van klassieke computers, reageren ze dan anders op slechte gegevens — en kunnen ze die gemakkelijker vergeten wanneer dat nodig is?

Figure 1
Figure 1.

Twee manieren om te leren van rommelige informatie

De auteurs vergelijken twee soorten neurale netwerken die op dezelfde taken worden getraind. Het ene is een vertrouwd klassiek netwerk, een stapel gewogen verbindingen die op een gewone computer draait. Het andere is een kwantumneuraal netwerk dat qubits en kwantumpoorten gebruikt om informatie in superpositie te verwerken. Beide moeten twee soorten classificatieproblemen oplossen: het onderscheiden van handgeschreven cijfers in de MNIST-dataset en het onderscheiden tussen twee toestanden van materie in een kwantumfysisch model. In elk geval contamineren de onderzoekers opzettelijk een deel van de trainingsgegevens, hetzij door de labels van sommige voorbeelden om te keren, hetzij door de invoerkenmerken te vervangen door willekeurige ruis, en observeren vervolgens hoe elk model ermee omgaat.

Wanneer labels liegen, houden kwantummodellen stand

Het meest opvallende verschil verschijnt wanneer labels worden omgedraaid. Het klassieke netwerk probeert elk trainingsvoorbeeld te bevredigen, inclusief de tegenstrijdige, en draait geleidelijk zijn interne beslissingsgrens om ze te passen. De prestatie op nieuwe, niet eerder geziene gegevens neemt gestaag af naarmate meer labels worden gecorrumpeerd. Daarentegen vertoont het kwantumnetwerk een robuust plateau: over een breed bereik van ruisniveaus blijft het schone validatiegegevens goed classificeren en negeert het effectief verkeerd gelabelde uitschieters. Pas wanneer de gecorrumpeerde labels dominant worden — ongeveer op het punt waar de helft van de labels fout is — stort de prestatie plotseling in, in een scherpe verandering die aan een fasetransitie doet denken. Dit gedrag suggereert dat de kwantumleerling de eenvoudigste, meest coherente patroon in de gegevens bevoordeelt en verspreide tegenstrijdigheden behandelt als irrelevante storingen totdat zij het ware signaal overweldigen.

Het vergeten van slechte training is gemakkelijker voor kwantummodellen

Buiten het weerstaan van corruptie bestuderen de auteurs “machine-ontleren”: hoe efficiënt een getraind model gedwongen kan worden de invloed van slechte gegevens te vergeten zonder van nul te moeten herbeginnen. Ze verkennen verschillende strategieën, zoals het opnieuw trainen op alleen het schone deel van de gegevens, fijn afstemmen van het vergifte model, het expliciet afstoten van de modelvoorspellingen ten opzichte van wat het op de slechte subset heeft geleerd, en het gebruiken van gradientestappen die het effect van die voorbeelden ongedaan maken. Voor het klassieke netwerk lopen alle efficiënte benaderende methoden achter op volledig hertrainen, wat aangeeft dat zijn interne representatie is verstard rond de vergiftigde monsters. Het kwantumnetwerk gedraagt zich anders. Zelfs beginnend vanaf een vergiftigde toestand kan het door benaderende ontleer-methoden worden gestuurd om binnen hetzelfde tijdsbestek de prestatie van een dure hertraining te evenaren of te overtreffen. Dit toont aan dat zijn geleerde representatie plastischer is — voldoende gestructureerd om nuttig te zijn, maar toch flexibel genoeg om gecorrigeerd te worden.

Figure 2
Figure 2.

Het verborgen landschap achter weerbaarheid en plasticiteit

Om deze contrasterende gedragingen te verklaren, bestuderen de auteurs het “verlieslandschap”, een hoog-dimensionaal oppervlak dat meet hoe goed het model de gegevens past bij elke instelling van zijn parameters. Goede generalisatie wordt geassocieerd met brede, vlakke valleien in dit landschap, terwijl broze overfitting vaak correspondeert met scherpe, smalle minima. Door te analyseren hoe de kromming van dit landschap verandert wanneer gegevens vergiftigd worden, concluderen ze dat klassieke netwerken een dramatische verharding ondergaan: een eens-vlakke regio rond de oplossing wordt extreem scherp naarmate het model verkeerd gelabelde punten memoriseert. Het ontsnappen uit dit steile dal tijdens ontleren is moeilijk, wat de hardnekkigheid van klassieke herinneringen verklaart. Kwantumnetwerken daarentegen behouden vrijwel dezelfde zachte kromming zelfs na vergiftiging. Hun landschappen zijn structureel stabiel, begrensd door de wiskunde van kwantumbewerkingen, wat de vorming van extreem scherpe minima voorkomt en het leren op natuurlijke wijze naar vloeiende, generaliseerbare oplossingen stuurt.

Wat dit betekent voor toekomstige betrouwbare AI

Voor een niet-specialist is de conclusie dat kwantum-machinelearning niet alleen gaat over snelheid of exotische hardware. In deze experimenten gedragen kwantummodellen zich meer als zorgvuldige redacteuren dan als obsessieve schrijvers: ze halen het hoofdverhaal uit rommelige gegevens, weerstaan invloed van een paar slechte voorbeelden en kunnen worden bewogen schadelijke invloeden te vergeten zonder helemaal opnieuw te worden opgebouwd. Deze combinatie van weerbaarheid tegen vergiftiging en bereidheid om te ontleren suggereert een nieuw soort kwantumvoordeel — één geworteld in betrouwbaarheid en veiligheid in plaats van alleen ruwe rekenkracht — en doet vermoeden dat toekomstige kwantum-versterkte AI-systemen betere partners kunnen zijn in een lawaaierige, voortdurend veranderende informatieomgeving.

Bronvermelding: Chen, YQ., Zhang, SX. Superior resilience to poisoning and amenability to unlearning in quantum machine learning. Nat Commun 17, 3716 (2026). https://doi.org/10.1038/s41467-026-70420-4

Trefwoorden: kwantum-machinelearning, datavergiftiging, machine-ontleren, robuuste AI, verlieslandschap