Clear Sky Science · zh

KidneyTox_v1.0 实现可解释人工智能对小分子肾毒性的预测

2026-01-13 · 返回目录

为何保护肾脏免受药物损害至关重要

许多救命药物可能在不为人知的情况下损害肾脏，有时会导致严重疾病，而这些问题往往直到为时已晚才显现。医生和药物开发者需要在新药进入患者之前就发现这种风险。本文介绍了 KidneyTox_v1.0——一款免费在线工具，它使用可解释的人工智能来预测小分子药物是否可能损害肾脏，并且关键在于向用户展示其得出结论的原因。

从分散数据到总体视角

研究者首先汇集了经过精心整理的565种已获批或处于试验阶段的药物。大约一半被报道在人体中会损伤肾脏，其余则无已知肾毒性。团队并未将这些化合物视为简单的清单，而是先绘制了它们的“化学邻域”——诸如分子大小、分子量、疏水性与亲水性倾向、环结构数量以及可发生旋转的键数等基本属性。研究发现这些化合物涵盖了非常广泛的范围：从小而高度亲水的分子到具有多环的大而灵活的结构。这样的多样性很重要；意味着该工具不局限于单一狭窄的药物化学类型。

教会计算机识别高风险分子

利用这一多样化的数据集，团队训练了一个机器学习模型——一种从示例中学习模式的计算程序，用以区分肾毒性药物与更安全的药物。该模型基于称为随机森林的方法，检查许多数值描述符以捕捉分子的形状、电荷分布及其他特征。在经过精心调参并选择最具信息量的描述符后，该系统对未见测试化合物的分类准确率约为84%。为确保这并非偶然，作者尝试了多种不同的训练—测试划分，发现所选模型始终表现优异，表明它学到的是通用规则而非记忆数据。

用可视化解释打开“黑箱”

人工智能在医学领域常被批评为“黑箱”：它可能预测某药物有危险，但无法说明原因。为了解决这一问题，作者在 KidneyTox_v1.0 中直接构建了可解释性机制。他们使用了一种称为 SHAP 的技术，为每个描述符在给定分子的最终预测中分配正向或负向贡献。实际上，用户会看到一个瀑布图——红色条推动预测向“有毒”方向，蓝色条推动向“无毒”方向。例如，某些与电负性相关的特征值较高往往将预测推向肾损害，而与总体分子柔性或极化能力相关的其他特征则常常支持更安全的特征。以兰索拉唑和环丙沙星等已知与肾问题相关的常见药物为例，案例研究展示了具体结构特征如何驱动模型发出警示信号，而相对安全的药物则显示相反的模式。

将相似性推理与人工智能见解结合

除了主模型之外，该研究还开发了所谓的 qRASAR 模型，它将机器学习描述符与毒理学中长期使用的“类比推断”（read-across）思想相结合。在这里，药物的风险部分基于其与已知有毒或无毒邻居的相似度以及邻域数据的一致性来推断。值得注意的是，一个仅基于三个相似度与误差特征的简化模型仍能取得良好表现，在准确性与透明性之间取得平衡。这意味着监管者和药物化学家不仅可以看到某个化合物类似于已知的肾毒药物，还能评估这种类比在其邻域数据下有多可靠。

用于设计更安全药物的实用工具

所有这些要素汇聚成 KidneyTox_v1.0——一个基于浏览器、具有用户友好界面的平台。化学家可以绘制新分子或将其标准文本编码（如 SMILES 字符串）粘贴到工具中，数秒内便可获得“有毒”或“无毒”的预测、基于与训练集相似度的置信度评估，以及与最相近已知邻居并列比较的图表。由于底层数据和代码是公开共享的，随着新的肾毒性信息出现，该平台可以不断改进和扩展，且公司可以在不将结构储存在远程服务器的情况下测试专有化合物。

这对患者与未来药物的意义

通俗地说，这项工作表明我们现在可以使用可解释的人工智能在药物进入临床试验或上架前很久就识别出更有可能损害肾脏的候选药物。通过揭示与肾损伤最密切相关的分子特征，KidneyTox_v1.0 能指导化学家做出更安全的设计选择——例如调整极性、环系或电荷分布以降低风险，同时保持疗效。尽管当前模型建立在几百种化合物之上，且随着更多数据的加入会不断改进，但它已代表了朝着更快、更便宜、更人性化的安全测试迈出的实用一步，最终目标是保护患者免受可避免的肾损害。

引用: Amin, S.A., Kar, S. & Piotto, S. KidneyTox_v1.0 enables explainable artificial intelligence prediction of nephrotoxicity in small molecules. Sci Rep 16, 5099 (2026). https://doi.org/10.1038/s41598-026-35496-4

关键词: 肾毒性, 药物安全, 人工智能, 机器学习, 化学信息学