Clear Sky Science · nl

VolE: Een point-cloud framework voor 3D-reconstructie van voedsel en volumeschatting

· Terug naar het overzicht

Waarom het meten van je avondeten ertoe doet

Calorieën tellen aan de hand van een foto klinkt als magie, maar voor artsen en diëtisten kan het een krachtig hulpmiddel zijn. Nauwkeurig weten hoeveel mensen daadwerkelijk eten is cruciaal bij het beheersen van aandoeningen zoals diabetes en obesitas, terwijl het wegen van elke maaltijd op een keukenweegschaal in het dagelijks leven onpraktisch is. Dit artikel presenteert VolE, een nieuwe methode waarmee een gewone moderne smartphone een gedetailleerd driedimensionaal model van één voedselschijf kan bouwen en het volume met verrassend hoge nauwkeurigheid kan schatten — zonder speciale hardware, referentiekaart of dieptesensor.

Figure 1
Figure 1.

Van simpele foto’s naar stevige vormen

Het kernidee van VolE is om een korte, informele video met je telefoon van je maaltijd om te zetten in een precieze 3D-vorm die gemeten kan worden. Terwijl een gebruiker de telefoon langzaam rond een bord beweegt, legt de ingebouwde augmented reality-functionaliteit van het apparaat (ARCore op Android of ARKit op iOS) zowel de beelden als de exacte positie en oriëntatie van de camera in de echte ruimte vast. VolE combineert deze beeldstromen en camerapaden om een dichte "point cloud" van het voedsel te reconstrueren — duizenden kleine punten in de ruimte die het oppervlak van het item volgen. Omdat het AR-systeem van de telefoon al echte afstanden kent, wordt dit virtuele object in de juiste fysieke schaal gemaakt, waarmee een al lang bestaande uitdaging in vision-onderzoek wordt opgelost: 3D-vorm kan worden herwonnen, maar niet altijd in de juiste grootte.

Het voedsel vinden en de scène schoonmaken

Voedselfoto’s zijn druk: borden, tafels en achtergrondrommel concurreren om aandacht. VolE pakt dit aan met een automatische videosegmentatiestap die werkt als een slimme schaar. Een model genaamd FoodMem identificeert welke pixels in alle frames van de video bij het voedsel horen, zelfs wanneer de telefoon beweegt en het voedsel gedeeltelijk verborgen raakt. Met behulp van de verfijnde camerapositities projecteert VolE de 3D-punten in elke gesegmenteerde afbeelding en behoudt alleen die punten die consequent op het voedsel vallen in elke weergave. Het resultaat is een schone, geïsoleerde puntenwolk die uitsluitend bij het doelobject hoort, terwijl de meeste achtergrondpunten en segmentatiefouten worden gefilterd.

Van stippen naar een meetbaar object

Point clouds alleen zijn lastig te meten, dus VolE zet ze om in een continue digitale oppervlakte die een mesh wordt genoemd. Gespecialiseerde 3D-software naait naburige punten aan elkaar tot kleine driehoekjes die om het voedsel heen liggen als een strak vel, vullen kleine gaten en maken het object "waterdicht." De mesh wordt vervolgens verfijnd door gladstrijking, ruisonderdrukking en optimalisatiestappen die bulten en gaten verwijderen zonder de werkelijke grootte op significante wijze te veranderen. Ten slotte wordt een wiskundige truc toegepast, bekend als de divergentiestelling: het oppervlak wordt in veel kleine stukjes verdeeld, elk behandeld als een klein piramidevormig element met de oorsprong als anker. Het optellen van de gesigneerde volumes van al deze stukjes levert het totale volume van het voedsel in kubieke centimeters op, klaar om via standaard dichtheidstabellen naar gewicht en calorieën te worden omgezet.

Figure 2
Figure 2.

Testen op echte etenswaren en lastige benchmarks

Om te beoordelen hoe goed VolE werkt, bouwden de auteurs een nieuwe "Foodkit" dataset van 21 echte voedingsmiddelen — van appels en bananen tot wraps en gebak — vastgelegd met 700–1200 beelden per item. Ze maten het werkelijke volume met waterverplaatsing en de massa met een laboratoriumweegschaal, en vergeleken deze waarden met de schattingen van VolE. Over alle items lag de gemiddelde volumefout rond de 1–2%, wat overeenkomt met ongeveer 99% nauwkeurigheid, en bleef stabiel over herhaalde runs ondanks interne willekeur in de reconstructiesoftware. VolE werd ook geëvalueerd op uitdagende openbare datasets die in internationale competities worden gebruikt, en presteerde beter dan of gelijk aan de beste bestaande methoden voor inschatting van voedselvolume, terwijl het geen kalibratiekaarten, dieptesensoren of vaste camerarigs nodig had.

Wat dit betekent voor alledaagse gezondheid

In eenvoudige bewoordingen laat dit werk zien dat een telefoon die je al bezit, met de juiste algoritmen je voedsel bijna zo goed kan meten als labapparatuur. Door informele video’s om te zetten in nauwkeurige 3D-modellen, elimineert VolE de noodzaak voor weegschalen, gespecialiseerde scanners of zorgvuldig opgezette foto’s met referentieobjecten. Hoewel het momenteel het beste werkt voor één hoofditem op een bord en de verwerking nog op een krachtige computer plaatsvindt in plaats van direct op de telefoon, wijst de methode op een nabije toekomst waarin dieet-tracking apps portiegroottes automatisch en betrouwbaar kunnen inschatten. Dat zou langdurige voedingsmonitoring objectiever, minder belastend en veel toegankelijker kunnen maken voor mensen die hun gezondheid in alledaagse omstandigheden beheren.

Bronvermelding: Haroon, U., AlMughrabi, A., Zoumpekas, T. et al. VolE: A point-cloud framework for food 3D reconstruction and volume estimation. Sci Rep 16, 8648 (2026). https://doi.org/10.1038/s41598-026-38756-5

Trefwoorden: inschatting van voedselvolume, 3D-reconstructie, mobiele gezondheid, augmented reality, voedingsbeoordeling