Clear Sky Science · zh
MaAsLin 3:改进和扩展广义多变量线性模型以发现宏组学关联
为何肠道微小邻居很重要
我们体内栖息着数万亿微生物,它们帮助消化食物、训练免疫系统,甚至可能影响我们的情绪。随着 DNA 测序让编目这些微生物群落变得容易,一个关键问题浮现:哪些特定微生物与炎性肠病等疾病,或与年龄和饮食等日常特征密切相关?要回答这个问题并不容易。数据嘈杂、充斥零值且通常以百分比形式报告而非真实计数。本文介绍了 MaAsLin 3——一种旨在从混乱的微生物组数据中提取更清晰信号的新统计工具,帮助研究人员更可靠地将微生物与人类健康和环境联系起来。

在嘈杂人群中寻找模式
传统的微生物组研究有点像在人群中数人脸:研究者测量数百到数千种微生物在多人中的相对丰度,然后询问哪些物种在例如病患与健康组之间存在差异。但微生物组数据受限于必须相加为100%的百分比,因此若一种物种上升,至少有另一种看起来下降,即便其真实数量并未改变。此外,许多物种在特定样本中根本未被检测到,产生大量零值,这些零值可能反映真实缺失或检测限。常用分析方法通常将两个不同的问题混为一谈——某种微生物是否存在,以及当存在时其数量多少——这会使得对底层生物学的解读产生偏差。
将存在性与数量分离
MaAsLin 3 通过明确将存在性和数量视为相关但独立的现象来应对这些问题。对于每一个微生物特征——例如物种、基因或代谢通路——它并行构建两个模型。一个模型考察普遍性,询问该特征在具有不同性状的样本中被检测到的频率;另一个模型关注丰度,询问在仅包含被检测到该特征的样本中,该特征的水平如何变化。通过这样分拆数据,MaAsLin 3 避免了用任意小数值填补零值的常见捷径,因为那样会扭曲结果。它随后将这两种效应合并成每个特征与每个性状相关联的整体图景,同时仍然允许研究人员判断某一关联主要与存在性、数量还是两者相关。
更接近真实世界的数量
微生物组科学的另一个复杂之处在于大多数测量是相对的:它们告诉我们某种物种占总体群落的比例,而不是实际有多少个细胞。然而许多生物学问题依赖于绝对丰度——例如某个致病体的细胞数是否超过可能触发疾病的阈值。MaAsLin 3 提供了两种互补的解决方案。当实验包含额外信息时,比如已知数量的参考生物或总体微生物负荷的估计,该方法可以将相对百分比转换为绝对计数的估算并直接对其建模。当无此类数据时,MaAsLin 3 则将每个特征的行为与所有特征的典型模式进行比较,在现实假设下这可近似于在绝对尺度上观察到的情况。大量计算机模拟和在具有实验测量绝对丰度的真实数据集上的测试表明,该策略能准确恢复底层趋势,并优于若干广泛使用的工具。

在肠道疾病中揭示隐匿信号
为了展示这些改进在实践中的意义,作者将 MaAsLin 3 应用于一个大型且研究充分的队列,该队列包含有无炎性肠病(如克罗恩病和溃疡性结肠炎)的人群。早期研究已经识别出这些疾病中的许多微生物变化,但 MaAsLin 3 增添了多层次的细节。它确认了大多数已知关联,同时澄清约四分之三的关联涉及的是微生物是否被检测到的变化,而非它们在检测到时的丰度变化。换言之,肠道炎症常常伴随某些有益微生物的完全丧失或无法被检测到,而不仅仅是其水平的轻微下降。该方法还揭示出一些仅凭存在性本身——不论数量多少——就与疾病相关的微生物,这些微生物的出现与肠道群落的破坏紧密相关。
对未来研究与护理的意义
对非专业读者而言,关键的信息是我们分析微生物组数据的方式会显著影响我们认为什么微生物与健康相关。通过更好地处理零值、将存在性与数量分离并近似真实细胞计数,MaAsLin 3 为发现可靠的疾病、饮食和环境微生物标志物提供了更清晰的放大镜。在炎性肠病中的结果表明,许多具有临床相关性的变化涉及微生物的消失或新出现,而不仅仅是丰度的缓慢增减。这一区别对设计治疗策略至关重要:如果疾病与有益物种的彻底丧失相关,那么重新引入或保护这些微生物的策略可能比仅试图微调群落平衡的方法更有效。因此,MaAsLin 3 为研究人员提供了一个更精确、更灵活的工具箱,将复杂的微生物组测量转化为可操作的生物学见解。
引用: Nickols, W.A., Kuntz, T., Shen, J. et al. MaAsLin 3: refining and extending generalized multivariable linear models for meta-omic association discovery. Nat Methods 23, 554–564 (2026). https://doi.org/10.1038/s41592-025-02923-9
关键词: 微生物组, 炎性肠病, 统计建模, 绝对丰度, 微生物普遍性