Clear Sky Science · zh

荧光标记DNA中荧光闪烁的隐马尔可夫模型分析

· 返回目录

为什么微弱的光闪很重要

在现代生物实验室里,研究人员经常通过将荧光染料连接到单个DNA分子上来观察它们,这些染料像微型灯塔一样闪烁。那些闪烁包含了关于电子如何在DNA中迁移以及局部环境如何变化的丰富信息,但信号被显微镜与环境的噪声深深掩盖。本文展示了如何使用来自机器学习的一种统计工具——隐马尔可夫模型(HMM),从噪声闪烁中筛选出真实的发光与不发光时段以及每个状态持续的时间——把杂乱的光学轨迹转化为清晰的物理见解。

追踪DNA上的单个发光标签

该研究聚焦于在特定位点标记红色荧光染料(ATTO655)的DNA链,链上还包含能俘获电荷的特殊碱基。在恒定激光照射下,染料在发射的“开(ON)”态与不发射的“关(OFF)”态之间交替。在ON态下,染料不断吸收光子并以荧光重新发射。在OFF态下,电子已被转移,染料处于电荷分离构型,无法发光。当科学家以非常短的时间片段记录到达探测器的光子数——此处为半毫秒——得到的是参差不齐的时间序列,其中高低光子计数应分别反映ON和OFF时段,但却被随机波动与背景光严重扭曲。

Figure 1
Figure 1.

教模型在噪声中“倾听”

为了解码这些闪烁轨迹,作者使用了隐马尔可夫模型(HMM),这一框架在语音识别与金融中广为人知,但在材料科学中仍未充分利用。在这里,隐含状态就是ON与OFF,观测到的数据是每个时间箱中的光子计数。研究团队假设,一旦每箱收集到足够的光子,则每个状态的计数可以用具有不同均值的光滑钟形(高斯)分布来近似。通过一种贝叶斯抽样程序,交替更新隐状态序列与描述这些分布及切换速率的参数,HMM逐步学会哪段轨迹最有可能对应发光或不发光的DNA。结果是得到一个远比噪声光子记录更清晰的二态轨迹,并估计出ON与OFF之间转变的概率。

计时亮与暗的间隔

在获得可靠的状态序列后,作者统计每个ON或OFF事件的持续时间。他们构建了“闪烁图”,即每种状态驻留时间的概率分布,发现ON和OFF持续时间都遵循简单的指数衰减。从这些曲线中提取出的特征弛豫时间大约为:ON态约17.6毫秒,OFF态约7.8毫秒。与单个染料分子本征的发射过程(发生在纳秒量级)相比,这些几十毫秒的间隔极其漫长。ON态更像一个准稳态,在此期间染料经历许多快速的吸收—发射循环,才会相对罕见地切换到OFF态。较长的OFF期表明DNA—染料系统中存在出人意料地稳定的电荷分离构型,意味着电荷复合——返回发光态——相对缓慢。

当数据形状成就或破坏分析时

有趣的是,研究人员发现HMM的成功很大程度上取决于光子计数直方图的形状——即每个时间箱中各种光子计数出现频次的统计。当该直方图清晰地显示出两个峰(分别对应ON和OFF)时,模型能恢复出清晰的状态序列。当两个峰合并成单个宽峰时,即便整体平均值如平均光子数与事件数量仍被正确捕获,状态识别也会变得更为模糊。团队展示了增大时间箱宽度往往能使ON与OFF分布分离并产生两个峰,从而提高鲁棒性,但代价是丢失对极短寿命事件的信息。他们给出实用经验规则:可可靠测量的最短状态持续时间是所选时间箱宽度的若干倍,而且目视可见的双峰直方图是分析可信性的良好指标。

Figure 2
Figure 2.

这对解读分子闪烁意味着什么

通过将单分子荧光实验与精心构建的隐马尔可夫模型相结合,这项工作把噪声闪烁从一种困扰转变为一种定量探针,用以研究电子沿DNA的运动。OFF态持续约八毫秒的发现表明,在该DNA—染料构型中电荷分离态异常长寿,而大约18毫秒的ON期表明在每次变暗之前可以发射许多光子。同样重要的是,文章明确说明了时间箱宽度和信号质量等选择如何决定此类时间序列分析是否可靠,并为未来实验提供了清晰的检查清单。总体而言,这些进展使研究人员更接近于直接从微弱的光闪中读取生物分子的详细电学与结构行为。

引用: Furuta, T., Fan, S., Takada, T. et al. Hidden Markov model analysis of fluorescence blinking in fluorescently labeled DNA. Sci Rep 16, 11306 (2026). https://doi.org/10.1038/s41598-026-40876-x

关键词: 单分子荧光, DNA 电子转移, 荧光闪烁, 隐马尔可夫模型, 光子计数