Clear Sky Science · nl

Gebruik van machine learning en stemgeluid voor multiclass-classificatie van de ziekte van Parkinson, chronische obstructieve longziekte en gezonde controles

· Terug naar het overzicht

De ziekte horen via de menselijke stem

De meesten van ons denken zelden na over hoeveel onze stem prijsgeeft over onze gezondheid. Toch kunnen subtiele veranderingen in toonhoogte, stabiliteit of ademgeluid aanwijzingen bevatten over aandoeningen die de hersenen en longen aantasten. Deze studie onderzoekt of een korte opname van iemand die de klinker “ah” aanhoudt in een smartphone, gecombineerd met moderne machine learning, kan helpen mensen met de ziekte van Parkinson, mensen met chronische obstructieve longziekte (COPD) en gezonde oudere volwassenen van elkaar te onderscheiden.

Figure 1. Eenvoudige op de telefoon opgenomen klinkergeluiden worden in een model ingevoerd dat stemmen sorteert in Parkinson-, COPD- of gezonde groepen.
Figure 1. Eenvoudige op de telefoon opgenomen klinkergeluiden worden in een model ingevoerd dat stemmen sorteert in Parkinson-, COPD- of gezonde groepen.

Waarom Parkinson en COPD ons anders laten klinken

De ziekte van Parkinson staat vooral bekend om tremor en stijfheid, maar zorgt ook vaak voor zachtere, monotoonere en minder duidelijke spraak. COPD, een chronische longziekte, vernauwt de luchtwegen en bemoeilijkt de ademhaling, wat de stem zwak, hees of ademig kan maken. Hoewel beide ziekten de eenvoudige handeling van geluidproductie verstoren, ontbreken artsen nog veelal snelle en objectieve tests op basis van stem. De meeste eerdere onderzoeken lieten computers alleen beslissen tussen “patiënt” en “gezond”, meestal voor één ziekte tegelijk en binnen één taal. De auteurs stelden in plaats daarvan een moeilijkere en realistischere vraag: kan één systeem zeer eenvoudige spraakgeluiden in verschillende talen beluisteren en mensen tegelijk in drie groepen indelen?

Hoe de onderzoekers stemmen verzamelden en verwerkten

Het team combineerde twee grote stemdatabanken die op mobiele apparaten waren opgenomen. Eén, uit het mPower-project, bevatte Engelssprekenden met de ziekte van Parkinson en gezonde vrijwilligers. De andere, COPDVD genoemd, bevatte Zweedssprekenden met COPD en bijpassende gezonde controles. Om de groepen vergelijkbaar te maken, selecteerden de onderzoekers zorgvuldig vergelijkbare aantallen mannen en vrouwen met gelijke leeftijden en vergelijkbare aantallen opnames, wat resulteerde in 96 personen en 1.723 bruikbare opnames van aangehouden “ah”. Ze verwijderden stiltefragmenten en zetten vervolgens elke opname om in een beschrijving van 102 getallen die basale stemmetingen zoals toonhoogte en ruwheid vastlegde, evenals gedetailleerde spectrale vingerafdrukken die bekendstaan als Mel Frequency Cepstral Coefficients.

Figure 2. Een stem wordt omgezet in akoestische patronen, gaat door vier modellen die gezamenlijk stemmen, en eindigt als drie gescheiden stemclusters.
Figure 2. Een stem wordt omgezet in akoestische patronen, gaat door vier modellen die gezamenlijk stemmen, en eindigt als drie gescheiden stemclusters.

Een stemmend team van algoritmen leren luisteren

In plaats van op één machine-learningmethode te vertrouwen, bouwden de onderzoekers een “stemmend comité” van vier verschillende classifiers. Elk algoritme luisterde naar de feature-set van een opname en leverde zijn eigen gok of deze afkomstig was van de ziekte van Parkinson, COPD of een gezonde controle, samen met een waarschijnlijkheid voor elke optie. Deze waarschijnlijkheden werden vervolgens gemiddeld zodat het eindantwoord de consensus van de groep weerspiegelde. Om zichzelf te behoeden voor overfitting, hanteerde het team een strikte trainingsstrategie: modellen werden vele malen afgestemd en getest op afzonderlijke folds van de data, en de uiteindelijke prestatie werd beoordeeld op een volledig aparte set personen waarvan de opnames de algoritmen tijdens training nooit hadden gezien.

Wat het systeem in de stemmen hoorde

Op deze onafhankelijke testset haalde het ensemble ongeveer 84 procent algehele nauwkeurigheid en een gebalanceerde F1-score net onder 0,84, wat betekent dat het goed presteerde over alle drie de groepen ondanks verschillen in steekproefgrootte. Het systeem was bijzonder goed in het herkennen van de ziekte van Parkinson, die de hoogste precisie en recall liet zien. Gezonde stemmen werden met een gemiddelde voorspellingskracht geclassificeerd, terwijl COPD-stemmen het moeilijkst te identificeren waren en het vaakst verward werden met gezonde opnames. Opmerkelijk is dat Parkinson en COPD zelden met elkaar werden verward, wat suggereert dat hun vocale handtekeningen, hoewel beide afwijkend, op manieren verschillen die de algoritmen konden detecteren. Toen de onderzoekers onderzochten hoe klinkers de akoestische “ruimte” vulden die werd gedefinieerd door hun resonantiefrequenties, vonden ze subtiele maar consistente verschuivingen en spreidingen tussen de drie groepen, zelfs ondanks de taalverschillen.

Een kijkje in de zwarte doos

Om te begrijpen wat de beslissingen van het systeem aanstuurde, gebruikte het team een modern verklaringsinstrument dat elke stemfeature een invloedsscore toekent. Ze ontdekten dat de belangrijkste akoestische kenmerken niet voor elke groep hetzelfde waren. Leeftijd, gedetailleerde spectrale vormen en toonhoogtegerelateerde maten deden allemaal mee, maar in verschillende combinaties voor Parkinson, COPD en gezonde controles. Bijvoorbeeld, bepaalde spectrale beschrijvingen en formantpatronen waren meer beïnvloedend voor COPD, terwijl specifieke spectrale en toonhoogte-cues een sterkere rol speelden bij Parkinson. Dit patroon suggereert dat het model echt disease-specifieke aspecten van het produceren van een aangehouden klinker leerde, in plaats van alleen te detecteren dat een stem “ongewoon” klinkt.

Wat dit kan betekenen voor de dagelijkse zorg

Kort gezegd laat dit werk zien dat een korte, aangehouden “ah” opgenomen op een gewoon mobiel apparaat voldoende informatie kan bevatten voor een zorgvuldig ontworpen machine-learningsysteem om onderscheid te maken tussen hersengerelateerde en longgerelateerde stemproblemen en normale verouderingsstemmen. De aanpak vervangt geen medische diagnose en er zijn grotere, meer diverse studies nodig, maar het wijst op een toekomst waarin snelle, niet-invasieve stemchecks clinici kunnen ondersteunen bij het screenen en monitoren van mensen met de ziekte van Parkinson of COPD, zelfs over verschillende talen en omgevingen heen.

Bronvermelding: Idrisoglu, A., Behrens, A. Use of machine learning and voice for multiclass classification of Parkinson’s disease, chronic obstructive pulmonary disease, and healthy controls. Sci Rep 16, 15485 (2026). https://doi.org/10.1038/s41598-026-53409-3

Trefwoorden: Ziekte van Parkinson, COPD, stem-biomarker, machine learning, mHealth