Clear Sky Science · zh
用于肥胖女性膳食评估的人工智能应用的有效性有限
为何食物追踪应用可能无法呈现全部真相
许多人在尝试控制体重时会借助智能手机应用来记录饮食。这些工具承诺能将一张餐食快照转化为精确的卡路里计算。本研究检验了一款名为 SNAQ 的人工智能(AI)驱动应用是否能反映肥胖女性在日常生活中的实际能量消耗。研究结果对依赖这些数据来制定医疗决策、减肥方案或长期健康目标的人都具有重要意义。

研究如何设计
瑞士的研究人员招募了20名成年肥胖女性,在她们的正常日常生活中随访一周。每位参与者使用 SNAQ 应用拍摄所吃所饮的全部食物。该应用利用深度感应和计算机视觉把这些图片转化为每日卡路里和营养素的估算值。为了获得可靠的对照,团队还用被视为金标准的实验室方法——双标水法(doubly labelled water)测量每位女性的每日总能量消耗,该方法通过追踪无害示踪物从体内排出的速度来得出结果。此外,女性还完成了传统的24小时饮食回忆访谈,这是一种历史悠久但并不完美的回忆前一日摄入量的方法。
应用出了哪些问题
当研究人员将应用的估算与人体实际能量消耗比较时,差距很大。平均而言,女性的身体每天消耗约3000千卡,但 SNAQ 报告的数值仅约2200千卡——大约低估了25%。24小时回忆访谈的表现更差,约低估了真实摄入量的一半。关键问题是,误差并不一致:对某些女性应用略有高估,而对另一些则差距达数千卡。统计检验显示,对于任一个体,应用报告与机体代谢指示之间基本不存在可靠的一致性。
为何数值偏离如此之大
研究者将不匹配归因于人的行为因素和技术局限。在现实条件下,人们可能会忘记拍零食、环境光线变化或在画面中部分遮挡食物。AI 系统还必须推断每样食物的种类和分量,当分量很大、食物混合在一起或饮料装在不透明容器中时,判断便更困难。由于训练数据往往来自更标准化的餐食和较小分量,肥胖群体常见的饮食模式可能超出应用的适用范围。每一步的小错误累积起来,导致能量估算大幅波动,无法追踪体型、体成分或短期体重变化。

数字捷径的局限
尽管该应用的群体平均值看起来比基于访谈的回忆更接近实验室测量,但这种表面上的成功具有误导性。少数大的高估抵消了大量低估,掩盖了个体记录从日到日高度不稳定的事实。当团队应用可识别可疑饮食报告的标准筛查时,只有约三分之一的应用日记录可以被视为甚至是有可能准确的。该应用与关键生理标志物(如去脂体重或体重变化)也无显著相关性,进一步削弱了其作为精细监测工具的价值。
对病人和临床医生意味着什么
作者得出结论:SNAQ 以及可能的类似 AI 驱动的膳食应用尚不足以在肥胖女性中提供精确的膳食评估。大约四分之一的能量摄入被低估且表现不一致,可能会误导医生和患者,令他们对某种治疗是否有效做出错误判断。研究认为,在将此类工具整合到临床护理之前,必须像对待医疗器械或诊断测试那样,通过明确、标准化的准确性、稳定性与安全性测试。目前,数字化的便利应被视为一种有助于提高意识的辅助手段,而非用于就肥胖治疗做出严肃决定的独立衡量标准。
引用: Serra, M., Alceste, D., Jucker, N. et al. Limited validity of an AI-powered app for dietary assessment in females with obesity. npj Digit. Med. 9, 357 (2026). https://doi.org/10.1038/s41746-026-02536-2
关键词: 饮食追踪应用, 营养学中的人工智能, 肥胖管理, 膳食评估准确性, 数字健康验证