Clear Sky Science · zh
用于功能和进化特性的合成基因电路的生成式设计
教会细胞保持冷静
生物细胞面临持续不断的变化:食物出现与消失、温度波动、毒素来来去去。然而,许多细胞能够感知这些冲击并平稳地回到正常状态,这一技巧称为适应。工程师希望构建在医学、工业和环境修复中都能可靠工作的合成遗传“电路”。本文探讨了一种人工智能如何自动设计此类电路,不仅在当前表现良好,而且在随着突变和进化发生变化时仍能保持有用。

为什么构建智能基因电路很难
在合成生物学中,研究人员将基因连接起来,使细胞例如在检测到毒素时发光,或在营养不足时关闭生长。但这些电路经常失败:反应可能太弱、永远无法回到稳定状态,或在经历几次基因突变后停止工作。尽管科学家有数学模型和大量 DNA 部件库,可设计的电路数量极其庞大,微小变化可能带来巨大且难以预测的影响。因此,找到既能可靠响应信号又能在进化过程中保持功能的电路成为一大瓶颈。
构建一个 RNA 电路的虚拟游乐场
为了解决这一问题,作者们创建了一个纯数字的测试场。与其在真实细胞中试验,他们模拟了由三种相互作用的 RNA 分子构成的数百万个微小基因电路。专门的基于物理的软件预测每对 RNA 的结合强度,并将这些结合强度转换为控制 RNA 浓度随时间变化的反应速率。对于每个电路,团队模拟了当输入信号突然跃变时的情况,测量输出的响应强度(敏感性)以及回到起始水平的程度(精确性),并将两者合并为一个分数来表示电路的适应性能。
训练生成模型去发明新电路
利用这大规模的模拟数据集,作者训练了一种称为条件变分自编码器的生成式 AI。该模型学会将每个电路压缩为低维“潜在”表示再重构,同时被告知该电路的适应分数。训练好后,解码器可以接收期望的适应水平和随机噪声,从而生成许多被预测能达到该目标的新候选电路。研究者发现,即使是这种相对简单的模型也能高精度重现电路特性,而在给定提示时生成的多样化设计其模拟行为会围绕所请求的适应水平聚集——即便是略高于训练时见过的目标。
发现设计模式与进化权衡
通过可视化模型内部的潜在空间,团队发现电路自然按适应能力分组,这些分组与先前已知支持稳健适应的网络基元相匹配。换言之,在没有明确告知任何设计规则的情况下,AI 重新发现了关键的接线模式,比如特定的自相互作用和输入输出节点之间的连接。作者随后加入第二个目标:进化“崎岖度”,即在相互作用强度略微扰动(模拟突变)时电路行为变化的度量。一些适应性电路位于景观的平滑区域,许多小变化几乎没有影响;而另一些则处于崎岖地带,微小调整可能显著改变功能。值得注意的是,模型学会响应同时针对适应性和崎岖度的联合提示,能生成要么高度可进化要么高度稳定的电路,同时仍保持良好性能。

用简单目标引导复杂设计
这项研究还显示了如何向 AI 描述设计目标很重要。当研究者尝试分别输入敏感性和精确性,或加入超调等额外指标时,模型更难按提示行动。将适应性编码为单一且精心设计的分数——甚至是简单的是/否标签——通常效果更好。这表明,目前向生成模型提供能够捕捉目标行为本质的精简目标,而不是许多原始测量值,往往更为有效。
这对未来生物工程意味着什么
总体而言,工作表明生成式 AI 可以提出新的基因电路,这些电路不仅执行复杂的动态功能——在扰动后回归正常——而且可以被引导为对突变具有稳健性或易于进化。因为这些结果是用模拟 RNA 电路和相对较小的训练集获得的,类似策略有望应用于真实实验室数据。随着这类工具的成熟,工程师可能越来越依赖它们作为“设计伙伴”,建议在当前性能与未来进化行为之间取得平衡的有前途的电路架构,从而使未来的生物技术在真实世界中更加可靠和适应性更强。
引用: Gallup, O., Steel, H. Generative design of synthetic gene circuits for functional and evolutionary properties. npj Syst Biol Appl 12, 62 (2026). https://doi.org/10.1038/s41540-026-00683-6
关键词: 合成基因电路, 生成式机器学习, 生物适应, 进化稳定性, RNA 网络设计