Clear Sky Science · zh

基于纳米孔的大规模并行感测用于肽谱分析与蛋白质鉴定

· 返回目录

逐分子读取蛋白质

蛋白质是细胞的执行者,准确了解哪些蛋白存在、它们如何被修饰以及如何相互作用,对于理解健康与疾病至关重要。现有研究蛋白的主流工具虽然强大,但常常缓慢、昂贵且难以扩展。本文描述了一种新方法,通过观察个别蛋白片段穿过膜上的微小孔洞时产生的信号,并用人工智能将这些信号转换为详细的指纹。这一方法可能为更快、更廉价的疾病标志物检测以及检验研究和诊断用抗体的实际效能打开大门。

将蛋白质转化为可读取的片段

研究者基于最初用于DNA测序的纳米孔技术。在他们的体系中,天然蛋白先被切割成较短的片段(肽),并进行温和修饰,使每个片段两端都能与短段DNA相连。这就形成了“寡核苷酸–肽–寡核苷酸”的结构,使其在最初为DNA设计的纳米孔设备中表现良好。团队使用一种特定的切割酶,该酶倾向于在每个片段末端留下特定的氨基酸赖氨酸,从而使化学处理更可预测并适用于多种蛋白质。最终得到的是在仅数小时内制备出的、纯化的肽–DNA构建体库。

用大量纳米孔同时“倾听”

为了实际感测这些肽片段,作者使用了生物纳米孔阵列——嵌入膜中的微小蛋白质孔并接有电极。当施加电压时,分子马达会逐一将DNA–肽–DNA结构拉过每个孔。当肽通过最窄处时,会部分阻塞离子流,改变电流。由于该平台并行使用256个孔,并且可以在两小时内从单个文库收集超过10万个此类事件,它产生了海量的单分子信号流,捕捉到每个特定肽与孔相互作用的特征。

Figure 1
Figure 1.

从嘈杂信号到清晰指纹

表面上看,这些电流轨迹显得嘈杂且可变;相同的肽可能以不同方向进入并采用不同构象。传统的汇总指标如平均电流和事件持续时间在相似肽之间往往重叠。此项工作的关键进展是一种两步人工智能流程。首先,使用大量轨迹训练深度卷积神经网络以分类哪些肽产生了哪些模式。其次,团队构建“密度矩阵”,总结信号在每个事件过程中的变化趋势,本质上将嘈杂轨迹云转化为稳定的二维指纹。只有那些时间模式与这些指纹详细匹配的读数会被保留。该卷积神经网络加指纹策略将测试肽的准确率提升到约99%,并能可靠地区分仅相差一个氨基酸的片段、某些异构体以及细胞中蛋白常见的多种化学修饰。

检验抗体并识别整蛋白

由于抗体识别的是蛋白质的短片段,作者将其平台用于绘制各种商业抗体真实结合的片段位置。通过混合某激素前体的重叠肽片段、富集每种抗体结合的片段,然后用纳米孔系统读取这些片段,他们能够精确定位优选的结合区域,并揭示供应商推荐的抗体对何时实际上识别相同位点且不适用于夹心测定。在另一项测试中,他们检查了一个常用标签序列及其四个几乎相同的变体,显示每种肽的纳米孔读取相对数量与抗体结合强度高度一致,与更费时的表面测量结果相符。最后,他们演示了蛋白质鉴定:在对三种人源蛋白的肽指纹进行训练后,盲法消化完整蛋白并表明,被分类肽的组合模式足以正确判断蛋白身份,即便存在一些含糊或缺失的片段。

这对未来检测的意义

简单来说,这项研究表明,一台类DNA的纳米孔测序器,结合巧妙的化学处理与人工智能,可以作为一种高度并行的“听诊器”来检测蛋白片段。系统并不需要按序读取每个氨基酸,而是依赖来自数千个单分子事件的丰富统计指纹,来区分电荷、体积和修饰等微妙差异。这使得快速、低成本的抗体质量检测成为可能,并为基于肽图谱识别整蛋白提供了一条路径。尽管仍存在限制——例如对某些肽类型的检测困难以及对良好训练数据的需求——该工作描绘了一个端到端的流程,可能有助于将常规、高通量的蛋白质分析更快地引入日常研究实验室并最终进入临床诊断领域。

引用: Wang, J., Chen, J., Pan, H. et al. Nanopore-based massively parallel sensing for peptide profiling and protein identification. Nat Commun 17, 3058 (2026). https://doi.org/10.1038/s41467-026-69628-1

关键词: 纳米孔感测, 蛋白质组学, 肽指纹图谱, 抗体验证, 蛋白质鉴定