Clear Sky Science · zh

通过多用途、可扩展的生化选择,从室温档案实现全球规模的核酸库

· 返回目录

为何保存遗传物质重要

想象一下能够追踪新病毒、研究罕见病并保存整个生态系统的基因足迹,而无需成排耗能的超低温冰箱。如今,大多数 DNA,尤其是易变的 RNA,必须极低温保存,这既昂贵又对世界许多诊所和实验室不切实际。本文提出了一种新的方法,可以在室温下保存并检索海量基因样本,同时仍能快速找到科学家用于检测的特定样本。

Figure 1
Figure 1.

从冷冻库到微型胶囊

现代生物样本库保存着数以百万计的血液、唾液和组织样本,但通常每个样本装在自己的标记试管里放入大冰箱。随着样本规模增长,这种“每个样本一管”的方式变得昂贵且低效。冰箱需要持续供电,机器人系统逐个移动样本,若出现意外 RNA 可能降解。作者改用微观二氧化硅壳——微胶囊——来保护遗传物质。DNA 和 RNA 被封存在这些耐久微粒内部,在室温下保持稳定。多种不同的核酸可以共同储存在同一胶囊中,且大量胶囊可以合并到一个小试管里,大幅减少存储空间和能源需求。

把试管变成可搜索的数据库

保存样本只是问题的一半;研究人员还必须在新问题出现时能挑选出正确的子集。这项工作的关键创新是一个巧妙的条码方案,将每个胶囊视为微小的数据库记录。附着在每个胶囊外部的短 DNA 片段充当“标签”来描述样本:例如患者年龄、来源城市、采样的月与年、接种状态以及是否有症状。系统并非为每个可能的值分配唯一标签,而是重复使用一组紧凑的标签并以不同方式组合它们,类似于用数字书写数值或用组合编码类别。这种“类型感知”设计允许对标签进行简单的物理操作,从而模拟数字数据库执行的范围和筛选查询功能。

如何向分子发问

为了从拥挤的试管中检索特定样本,作者使用只粘附到带有匹配标签的胶囊的荧光探针。这些探针携带可用流式分选仪读取的彩色染料,分选器会将强烈发光的胶囊引导到一条通道,暗淡的引导到另一条。通过选择点亮哪些标签以及如何组合颜色,系统可以实现诸如 AND、OR 和 NOT 的逻辑运算。例如,选择“非有症状”意味着排除对有症状标签测试时发光的任何胶囊。诸如年龄段或日期区间的数值范围通过忽略编码年龄或日期中某些不那么重要的“位”来处理,因此单次查询就能提取标签落在所选窗口内的所有胶囊。

Figure 2
Figure 2.

用模拟暴发测试系统

为了证明他们的方法在实践中可行,研究者构建了一个小而现实的测试数据库,包含 96 个合成的 SARS-CoV-2 样本,模拟为从抵达波士顿的航空旅客采集。每个胶囊携带病毒 RNA 片段加上唯一的内部标识符和编码虚构患者与航班信息的外部标签。随后他们执行了一系列反映现实流行病学的问题查询:查找所有无症状旅客、选择特定年龄段以寻找变体模式,以及运行一个复杂的组合查询以筛选来自某城市、在 2020 年特定几个月内且为有症状或未接种疫苗的旅客。对检索到的胶囊进行测序确认了所需样本已高精度富集,即便目标群体只是整个池的一小部分。

真实患者样本可被保存的证明

除了合成测试样本外,团队还将来自真实患者且携带不同奥密克戎亚系的 SARS-CoV-2 样本封装起来。经过存储和恢复后,他们对病毒基因组进行测序,并将结果与未曾封装的相同样本进行比较。尽管使用的是极少量的病毒 RNA,该方法仍能恢复正确的变体,表明二氧化硅保护不会抹去微妙的基因差异。因为非目标胶囊可以在每次检索后保存,样本池可以反复使用,而简单的内部 DNA 标识符允许对档案进行持续的完整性检查,类似数字存储中的校验。

这对未来的意义

简而言之,这项研究表明遗传样本可以被装入微小耐用的胶囊,在室温下堆叠在狭小空间内,随后通过灵活的、类似数据库的检索方法被分离出来。该方法大幅减少对冰箱的依赖,同时允许运行将年龄段、地点、日期和健康状态组合在一次操作中的复杂查询。随着进一步扩展,这类室温档案可能支持全球病原体监测、精准医学,甚至在缺乏冷链基础设施的地区开展长期生态监测。该工作指向一个未来——世界的生物信息可以像云端文件一样被紧凑保存并便捷访问。

引用: Berleant, J.D., Banal, J.L., Rao, D.K. et al. Enabling global-scale nucleic acid repositories through versatile, scalable biochemical selection from room-temperature archives. Nat Commun 17, 2807 (2026). https://doi.org/10.1038/s41467-026-69402-3

关键词: 核酸存储, 分子数据库, DNA 条形码, 病原体监测, 室温生物样本库