Clear Sky Science · nl

Beperkte geldigheid van een door AI aangedreven app voor voedingsbeoordeling bij vrouwen met obesitas

· Terug naar het overzicht

Waarom een voedings‑tracking‑app niet het volledige beeld geeft

Veel mensen gebruiken smartphone‑apps om bij te houden wat ze eten, vooral bij gewichtsbeheersing. Deze tools beloven snelle foto’s van maaltijden om te zetten in precieze calorieaantallen. Deze studie testte of één dergelijke door kunstmatige intelligentie (AI) aangedreven app, SNAQ genaamd, daadwerkelijk weerspiegelt hoeveel energie vrouwen met obesitas in het dagelijks leven verbruiken. De bevindingen zijn relevant voor iedereen die op deze cijfers vertrouwt bij medische beslissingen, afvalplannen of lange termijn gezondheidsdoelen.

Figure 1
Figure 1.

Opzet van de studie

Onderzoekers in Zwitserland rekruteerden 20 volwassen vrouwen met obesitas en volgden hen een week lang tijdens hun normale dagelijkse routines. Elke deelnemer gebruikte de SNAQ‑app om alles wat zij at en dronk te fotograferen. De app gebruikte dieptesensoren en computervisie om deze foto’s om te zetten in schattingen van dagelijkse calorieën en voedingsstoffen. Als betrouwbare referentie maten de onderzoeksters daarnaast ieders totale dagelijkse energiegebruik met de gouden standaardmethode doubly labelled water, die bijhoudt hoe snel onschadelijke tracers het lichaam verlaten. Bovendien vulden de vrouwen traditionele 24‑uur voedingsinterviews in, een langgebruikte maar imperfecte manier om de inname van de vorige dag te herinneren.

Waar de app de fout in ging

Bij vergelijking van de app‑schattingen met het werkelijke energiegebruik van het lichaam bleken de verschillen groot. Gemiddeld gebruikte het lichaam van de vrouwen zo’n 3000 calorieën per dag, maar SNAQ rapporteerde slechts ongeveer 2200—een onderschatting van ruwweg 25 procent. De 24‑uur recall‑interviews deden het zelfs nog slechter en onderschatten ongeveer de helft van de werkelijke inname. Cruciaal is dat de fouten niet consistent waren tussen personen. Voor sommige vrouwen overschatte de app de calorieën licht, terwijl hij bij anderen duizenden calorieën miste. Statistische tests toonden praktisch geen betrouwbare overeenkomst tussen wat de app rapporteerde en wat de stofwisseling van het lichaam per individu aangaf.

Waarom de cijfers zo ver uiteenlopen

De onderzoekers wijzen zowel op menselijk gedrag als technologische beperkingen om de mismatch te verklaren. Onder realistische omstandigheden vergeten mensen mogelijk tussendoortjes te fotograferen, verandert de verlichting of bedekken zij voedsel gedeeltelijk. Het AI‑systeem moet bovendien raden wat elk item is en hoeveel ervan aanwezig is, wat moeilijker wordt bij grote porties, gemengde gerechten of dranken in ondoorzichtige verpakkingen. Omdat trainingsdata vaak afkomstig zijn van meer standaardmaaltijden en kleinere porties, kunnen eetpatronen die vaak voorkomen bij obesitas buiten het comfortgebied van de app vallen. Kleine fouten in elk stadium stapelen zich op, wat leidt tot schattingen van energie die sterk fluctueren en geen verband houden met lichaamsgrootte, lichaamssamenstelling of kortetermijngewichtsschommelingen.

Figure 2
Figure 2.

Beperkingen van digitale snelkoppelingen

Hoewel groepsgemiddelden van de app enigszins dichter bij de labmethode lagen dan de op interviews gebaseerde recalls, bleek dit schijnsucces misleidend. Enkele grote overschattingen compenseerden veel onderschattingen, waardoor verborgen bleef dat individuele registraties van dag tot dag zeer instabiel waren. Toen het team standaardcontroles toepaste die verdachte voedingsrapporten signaleren, kon slechts ongeveer een derde van de dagelijkse app‑registraties als zelfs maar plausibel nauwkeurig worden beschouwd. De app vertoonde ook geen noemenswaardige relatie met belangrijke fysiologische markers, zoals vetvrije massa of veranderingen in lichaamsgewicht, wat het nut voor nauwkeurige monitoring verder ondermijnt.

Wat dit betekent voor patiënten en zorgverleners

De auteurs concluderen dat SNAQ, en waarschijnlijk vergelijkbare AI‑gebaseerde dieetapps, nog niet betrouwbaar genoeg zijn voor precieze voedingsbeoordeling bij vrouwen met obesitas. Het consistent onderschatten van de energie‑inname met ongeveer een kwart—en dat op inconsistente wijze—kan artsen en patiënten gemakkelijk misleiden over waarom een behandeling wel of niet werkt. De studie stelt dat voordat dergelijke hulpmiddelen in de klinische zorg worden geïntegreerd, ze duidelijke, gestandaardiseerde tests van nauwkeurigheid, stabiliteit en veiligheid moeten doorstaan, vergelijkbaar met medische hulpmiddelen of diagnostische tests. Voorlopig moet digitale gebruiksvriendelijkheid worden gezien als een nuttige aanvulling om bewustzijn te vergroten, niet als een zelfstandig meetinstrument voor ingrijpende beslissingen over obesitasbehandeling.

Bronvermelding: Serra, M., Alceste, D., Jucker, N. et al. Limited validity of an AI-powered app for dietary assessment in females with obesity. npj Digit. Med. 9, 357 (2026). https://doi.org/10.1038/s41746-026-02536-2

Trefwoorden: voedingsdagboek-apps, kunstmatige intelligentie in voeding, behandeling van obesitas, nauwkeurigheid van voedingsbeoordeling, validatie van digitale gezondheid