Clear Sky Science · de

Begrenzte Gültigkeit einer KI-gestützten App zur Ernährungsbewertung bei Frauen mit Adipositas

· Zurück zur Übersicht

Warum eine Lebensmittel-Tracking-App nicht die ganze Geschichte erzählen kann

Viele Menschen nutzen Smartphone-Apps, um ihre Nahrungsaufnahme zu überwachen, besonders beim Versuch, ihr Gewicht zu kontrollieren. Diese Werkzeuge versprechen, schnelle Fotos von Mahlzeiten in präzise Kalorienangaben zu verwandeln. In dieser Studie wurde geprüft, ob eine solche KI-gestützte App namens SNAQ tatsächlich widerspiegelt, wie viel Energie Frauen mit Adipositas im Alltag verbrauchen. Die Ergebnisse sind wichtig für alle, die sich auf diese Zahlen zur Steuerung medizinischer Entscheidungen, Abnehmpläne oder langfristiger Gesundheitsziele verlassen könnten.

Figure 1
Figure 1.

Wie die Studie aufgebaut war

Forscher in der Schweiz rekrutierten 20 erwachsene Frauen mit Adipositas und begleiteten sie eine Woche lang in ihrem normalen Alltag. Jede Teilnehmerin nutzte die SNAQ-App, um alles, was sie aß und trank, zu fotografieren. Die App nutzte Tiefensensorik und Computer-Vision, um diese Bilder in Schätzungen zu täglichen Kalorien und Nährstoffen umzusetzen. Als verlässliches Maß verglichen die Wissenschaftler diese Schätzungen mit dem gesamten täglichen Energieverbrauch, gemessen mit der Goldstandard-Methode der doppelt markierten Wasserstoffisotope, die verfolgt, wie schnell harmlose Tracer den Körper verlassen. Zusätzlich absolvierten die Frauen traditionelle 24-Stunden-Ernährungsinterviews, ein lang etablierter, aber fehleranfälliger Weg, die Aufnahme des Vortags zu erinnern.

Worin die App falsch lag

Beim Vergleich der App-Werte mit dem tatsächlichen Energieverbrauch des Körpers waren die Abweichungen groß. Im Durchschnitt verbrauchten die Körper der Frauen etwa 3000 Kalorien pro Tag, aber SNAQ gab nur rund 2200 an — eine Unterschätzung von etwa 25 Prozent. Die 24-Stunden-Erinnerungsinterviews schnitten noch schlechter ab und unterschätzten ungefähr die Hälfte der tatsächlichen Aufnahme. Entscheidend ist, dass die Fehler von Person zu Person nicht konsistent waren. Bei einigen Frauen überschätzte die App die Kalorien leicht, bei anderen lag sie um Tausende daneben. Statistische Tests zeigten im Grunde keine zuverlässige Übereinstimmung zwischen den App-Angaben und dem, was der Stoffwechsel des Körpers für eine einzelne Person anzeigte.

Warum die Zahlen so stark abweichen

Die Forscher führen die Diskrepanz sowohl auf menschliches Verhalten als auch auf technologische Grenzen zurück. Unter Alltagsbedingungen vergessen Menschen möglicherweise Snacks zu fotografieren, ändern die Beleuchtung oder decken Lebensmittel teilweise ab. Das KI-System muss zudem erraten, um welches Lebensmittel es sich handelt und wie viel davon vorhanden ist, was schwerer wird, wenn Portionen groß sind, Speisen vermischt sind oder Getränke in undurchsichtigen Gefäßen serviert werden. Da Trainingsdaten oft aus standardisierteren Mahlzeiten und kleineren Portionen stammen, können Essgewohnheiten, die bei Adipositas häufiger vorkommen, außerhalb der Trainingsrealität der App liegen. Kleine Fehler in jedem Schritt summieren sich, sodass die Energie-Schätzungen stark schwanken und nicht mit Körpergröße, Körperzusammensetzung oder kurzfristigen Gewichtsschwankungen übereinstimmen.

Figure 2
Figure 2.

Grenzen digitaler Abkürzungen

Obwohl die Gruppenmittelwerte der App etwas näher an der Labormethode lagen als die interviewbasierten Erinnerungen, erwies sich dieser scheinbare Erfolg als irreführend. Einige wenige starke Überschätzungen glichen viele Unterschätzungen aus und verdeckten, dass einzelne Aufzeichnungen von Tag zu Tag sehr instabil waren. Als das Team Standardchecks anwandte, die verdächtige Ernährungsberichte herausfiltern, konnten nur etwa ein Drittel der täglichen App-Einträge als auch nur plausibel genau angesehen werden. Die App zeigte außerdem keine sinnvolle Beziehung zu wichtigen physiologischen Markern wie fettfreier Masse oder Gewichtsschwankungen, was ihre Nützlichkeit für sorgfältiges Monitoring weiter einschränkt.

Was das für Patientinnen und Behandelnde bedeutet

Die Autorinnen und Autoren kommen zu dem Schluss, dass SNAQ und wahrscheinlich ähnliche KI-basierte Ernährungs-Apps noch nicht zuverlässig genug sind für präzise Ernährungsbewertungen bei Frauen mit Adipositas. Eine Unterschätzung der Energiezufuhr um etwa ein Viertel — und das zudem inkonsistent — könnte Ärztinnen, Ärzte und Patientinnen leicht in die Irre führen, wenn es darum geht, warum eine Behandlung wirkt oder nicht. Die Studie argumentiert, dass solche Werkzeuge, bevor sie in die klinische Versorgung integriert werden, klare, standardisierte Tests in Bezug auf Genauigkeit, Stabilität und Sicherheit bestehen müssen, ähnlich wie medizinische Geräte oder diagnostische Tests. Vorläufig sollte digitale Bequemlichkeit als hilfreiche Ergänzung zur Sensibilisierung betrachtet werden, nicht als alleiniges Messinstrument für ernsthafte Entscheidungen in der Adipositasbehandlung.

Zitation: Serra, M., Alceste, D., Jucker, N. et al. Limited validity of an AI-powered app for dietary assessment in females with obesity. npj Digit. Med. 9, 357 (2026). https://doi.org/10.1038/s41746-026-02536-2

Schlüsselwörter: Ernährungstracking-Apps, Künstliche Intelligenz in der Ernährungswissenschaft, Adipositasmanagement, Genauigkeit der Ernährungsbewertung, Validierung digitaler Gesundheitsanwendungen