Clear Sky Science · zh

机器学习辅助的单分子检测:迈向无标准定量的全氟和多氟烷基羧酸

· 返回目录

这对日常饮水安全为何重要

被称为PFAS的无形工业化学物质已渗入河流、饮用水,甚至进入我们的血液。其中,全氟和多氟烷基羧酸(PFCA)尤为令人担忧,但极其难以准确测量,因为成千上万种PFAS中仅有极少数具备参考标准。本研究提出了一种新方法,能够在一个微小的生物孔道中逐一“计数”流经的PFCA分子,利用机器学习识别它们的电学指纹——无需为每种化合物配备对应的实验标准。

复杂家族中的隐匿化学物

PFAS是一类广泛的富氟化学品,应用于不粘锅、灭火泡沫等众多产品。许多化合物仅在几处原子上有所不同,而这些微小的结构变化就能显著改变它们在环境中的迁移、在生物体内的累积或对健康的影响。传统的液相或气相色谱联用质谱等技术能以高灵敏度检测许多PFAS,但通常需要每种化学物的纯标准才能可靠识别和定量。目前商业化标准仅覆盖了一百多种PFAS——不到已知数量的1%,这让监管者和科学家对其余大部分几乎无从得知。

Figure 1
Figure 1.

通过微小通道计数单个分子

研究人员用一种蛋白质纳米孔来弥补这一空白:这种甜甜圈状分子在脂质膜上形成单一孔道。当施加电压时,离子通过孔道产生稳定电流。团队将单个PFCA化学键合到带正电的短肽“引导”段上,这些复合体像串珠一样被拉入纳米孔。当每个PFCA–肽对进入并占据孔道时,会部分阻断离子流,造成短暂的电流下跌,其深度和持续时间取决于孔内分子的大小与形状。

将孔道信号变成分子尺

这项工作的关键突破在于,这些电流下降表现得像一把精确的测量尺。通过将实验与分子模拟结合,作者表明对于一系列最长至14个碳的PFCA分子,电流阻断的深度几乎与分子体积呈正比线性增长。换言之,一旦纳米孔和肽段确定,只有体积就能预测电流被阻断的强度。这使团队能预测其他更复杂PFCA的电学特征——例如含氢或氯取代、支链或芳香环的分子——并在实验上验证这些预测与实测值在极小的测量误差范围内吻合。

能辨认相似污染物的机器学习

由于许多PFCA同族体在尺寸上非常接近,以致它们的阻断信号会重叠,科学家因此利用了纳米孔信号的全部丰富信息。他们从每次事件中提取数十个特征,包括事件持续时间、噪声特性,以及当信号在不同频率下进行数字滤波时形态的变化。使用在这些多维指纹上训练的机器学习模型,他们在13种PFCA类型(包括亲缘极近的构型异构体)上达到了近乎完美(约99.9%)的识别准确率。通过精心挑选出21个最具信息量的特征,他们在降低模型复杂度的同时实际提升了性能,即便当目标化合物被其他浓度高100倍的PFCA干扰时依然表现良好。

Figure 2
Figure 2.

从单分子计数到现实水样检测

除了识别之外,该方法还需要测量每种PFCA的含量。团队利用PFCA–肽复合体被纳米孔捕获的速率:随着浓度上升,事件之间的平均间隔缩短。巧妙的肽设计确保了捕获率主要由肽的电荷和孔的电势景观决定,而与所连的PFCA关系不大。这意味着可以使用单一校准曲线——将事件频率与浓度联系起来——覆盖多种PFCA,实现作者所称的“一个校准曲线适用于所有”。他们在混合样品及自来水和血清等复杂样品中验证了这一通用性,显示即便存在许多其它化学物也能给出准确计数,并且对超短链PFCA(三氟乙酸)的检测限可与最佳质谱方法相媲美。

无需定制标准即可追踪PFAS的新路径

综上所述,这项工作描绘了一条监测广泛PFCA污染物的路径,而无需为每种物质配备专门的标准。精心设计的纳米孔与肽探针在分子体积与信号之间建立了简单的线性关联,机器学习则从微妙的信号特征中区分出即便几乎相同的异构体。通过进一步调节孔道的入口与出口“势垒”,作者在实验与模拟中展示了该策略可扩展到更长链的PFCA,甚至可能扩展到更广泛的PFAS家族。对公众而言,这意味着一种有前景的新方式,去观察和测量长期以来在我们的水体与环境中大多保持隐形的化学物质。

引用: Zuo, J., Li, HS., Tang, W. et al. Machine learning assisted single-molecule sensing towards standard-free quantification of per- and polyfluoroalkyl carboxylic acids. Nat Commun 17, 3923 (2026). https://doi.org/10.1038/s41467-026-70718-3

关键词: PFAS, 纳米孔传感, 单分子检测, 机器学习, 水体污染物