Clear Sky Science · zh

利用似然方法推断具有二阶朗之万动力学的粒子群体异质性

· 返回目录

为何微小运动能揭示重大秘密

从徘徊的细菌到体内游走的细胞,生命体很少以完全相同的方式移动。每个个体都有其特性,但实验通常只能捕捉到它们运动的短暂且嘈杂的片段。本研究展示了如何将这些碎片化的轨迹转化为关于群体实际多样性的一幅清晰图景,所用的统计工具在运动看似随机且仅记录位置(而非速度)时仍然有效。

观察众多微小旅行者

现代显微镜和相机可以追踪成群的细胞、微生物或其它“活性粒子”如何爬行、游动或滑行。但在实际中,每个细胞可能很快从视野中消失,或被邻近个体遮挡,导致只能得到许多不同粒子的短轨迹,而不是少数个体的长时间序列。除此之外,即便是基因相同的微生物或细胞也不会完全相同地移动:有些更具持续性,有些更为无序,还有些对环境的响应不同。忽视这种个体差异会导致对整体行为的误判。

从随机轨迹走向隐藏规则
Figure 1. 许多不同的运动粒子产生的短轨迹揭示了其运动中潜在的多样性格局。
Figure 1. 许多不同的运动粒子产生的短轨迹揭示了其运动中潜在的多样性格局。

为理解此类运动,研究者常用“朗之万”模型来描述:将运动视为规律趋势与随机冲击的组合。对于许多活性系统,仅观察位置的变化并不足以描述运动,因为底层速度会随时间波动并为运动引入记忆效应。这使得观测到的位置呈现非马尔可夫性,意味着下一步不仅取决于当前步。基于步间变化估计模型参数的标准方法在只测量位置而真实速度被隐藏时会产生偏差。作者表明,简单方法可能系统性地误估关键量,比如粒子改变方向的速率或随机冲击的强度。

更聪明地解读嘈杂数据

论文的核心是一种新的近似方法,用于在给定记录轨迹的情况下评估某组模型参数的似然性。与其假设粗糙的有限差分速度等同于真正的瞬时速度,该方法谨慎地考虑到观测到的运动在短时间窗内被平滑处理的事实。在数学上,这会导致一种描述:这些“割线速度”由具有特定短程相关性的有色噪声驱动。通过将这些相关性以结构简单的紧凑矩阵捕获,作者推导出可快速求值的似然公式,即便对点数众多的长轨迹也适用。

从个体到群体的放大视角
Figure 2. 通过按似然对所有可能的运动参数加权,短且嘈杂的轨迹可以合成出更清晰的群体轮廓。
Figure 2. 通过按似然对所有可能的运动参数加权,短且嘈杂的轨迹可以合成出更清晰的群体轮廓。

在能写出单个轨迹在给定参数下的似然之后,作者更进一步允许这些参数在不同粒子间变化。他们将整个人群视为从一个未知分布中抽取,然后询问哪一个分布能最好地同时解释所有观测到的轨迹。为此,他们使用期望最大化(EM)方案,在估计每条轨迹对应不同参数值的概率与更新整体群体分布之间交替进行。这种“全似然”方法优于先对每条轨迹单独拟合再对这些点估计值拟合分布的两步法,尤其在轨迹较短且对每个个体的不确定性较高时表现更好。

评估我们的确定性

除给出群体变异性的最优拟合外,该框架还提供了量化该拟合不确定性的方法。通过检查似然在其极大值周围的尖锐程度,作者计算了海森矩阵,其逆矩阵估计在重复实验中推断出群体参数的预期散布。这给出了置信区域,显示由于数据有限,推断分布可能发生的偏移。对模拟数据的测试,包括具有偏好速度和旋转倾向的活性粒子模型,表明随着采样更精细和轨迹更长,该方法能可靠地重建施加的异质性。

这对研究生命运动意味着什么

简单来说,文章提出了一种将运动数据中两种随机来源区分开的方案:个体随时间的随机抖动与群体中个体之间真实的差异。通过恰当处理短的、仅含位置信息的轨迹以及隐藏在其后的速度,该方法能更清晰、更坦率地呈现一组移动粒子或细胞的多样性,以及我们对此结论的信心水平。这为更细致、以数据为驱动的复杂运动系统建模铺平了道路,从组织中迁移的细胞到工程材料中的自驱动粒子均适用。

引用: Albrecht, J., Opper, M. & Großmann, R. A Likelihood Approach for Inference of Population Heterogeneity in Particle Ensembles with Second-Order Langevin Dynamics. Commun Phys 9, 165 (2026). https://doi.org/10.1038/s42005-026-02670-z

关键词: 活性物质, 细胞运动性, 随机建模, 群体异质性, 轨迹分析