Clear Sky Science · zh

用于从透射光显微镜预测荧光的二维多模态图像集合

· 返回目录

在不做大量预处理的情况下观察细胞

现代生物学常依赖发光染料来揭示活细胞内部的动态,但这需要时间、成本,并可能损害细胞健康。本文介绍了 Light My Cells 数据库——一个大型公共显微图像集合,旨在帮助计算机从更温和、无需标记的图像重建这些发光视图。对于关心人工智能如何减少化学染色需求同时仍能展示细胞内部活动的人来说,这项工作奠定了基础。

Figure 1. 使用智能计算模型将温和的光学显微镜下细胞视图转换为丰富的荧光样图像。
Figure 1. 使用智能计算模型将温和的光学显微镜下细胞视图转换为丰富的荧光样图像。

为何荧光标记既有用又有风险

荧光显微镜可以让科学家标记细胞的特定部分使其发光,从而便于追踪如细胞核或线粒体等结构。然而,用荧光染料制备样本既费时又昂贵,而且暴露在光照下会使信号衰退甚至伤害细胞。在长期实验或大规模筛选项目中,这些问题会被放大,因为需要获取成千上万张图像。相比之下,诸如明场或相差等简单的透射光技术温和且无需标记,但它们无法直接指出各结构的身份。Light My Cells 的核心思想是通过训练计算机从这些简单、不具破坏性的视图推断出类荧光图像,从而弥合这一差距。

全国范围的多样化细胞图像集合

为实现这一目标,法国各地的成像专家联手建立了这一丰富的共享数据集。Light My Cells 数据库收集了 56,984 张二维图像,分为 2,574 个配对集,来自八个成像中心和 30 项独立研究。每个配对集展示了同一视野的哺乳动物活细胞,先以透射光拍摄,然后用一个或多个荧光标签标示细胞核、线粒体、微管或肌动蛋白。图像在各类显微镜和多种样本类型上采集,捕捉了现实实验室每天遇到的差异性。这种多样性对于训练能应对不同仪器、细胞系和采集条件而不是仅适应某一单一标准环境的深度学习模型至关重要。

Figure 2. 利用一组普通细胞图像堆栈,通过单一学习过程生成不同细胞内部结构的独立彩色视图。
Figure 2. 利用一组普通细胞图像堆栈,通过单一学习过程生成不同细胞内部结构的独立彩色视图。

图像为计算机标准化的方式

由于数据来自多个站点,团队在发布前构建了严格的预处理流程。所有原始文件(多为专有显微镜格式)被转换为一种通用的开放格式 OME-TIFF,该格式既保存图像也记录详细的采集信息。贡献者填写了丰富的元数据模板,描述样本、光路、物镜和标记策略,并遵循可重用成像数据的社区指南。对于在不同深度拍摄的图像堆栈,算法自动选择最佳聚焦切片:对透射光和荧光信号分别使用了不同调优的方法。所有透射光切片均被保留,而每个荧光通道被简化为单张清晰平面,以匹配常见的学习任务——从无标记输入预测一张清晰的荧光视图。

数据库包含的内容及质量检查

最终资源包括五万多张透射光图像,主要是明场,也包括相差和微分干涉对比(DIC),以及四千多张配对的荧光图像。细胞核和线粒体样本较为丰富,而微管和肌动蛋白出现较少,形成了用户在训练模型时需要考虑的天然类别不平衡。档案中的每项研究均有结构化描述生物模型、成像硬件和采集设置,便于用户按背景筛选或比较条件。作者还进行了技术检查以移除损坏文件、核对元数据字段完整性,并确认所选焦平面与专家判断一致。测试脚本确保像 ImageJ、Napari 及常用 Python 库等常见工具可以轻松打开和处理这些图像。

研究人员如何使用这一开放资源

除了作为深度学习挑战的原始用途外,Light My Cells 数据库旨在成为翻译或分析无标记图像方法的一般测试平台。配对数据使其适用于诸如从透射光预测荧光、分割细胞结构或在无额外染色情况下表征细胞状态等任务。由于保留了透射光堆栈,研究人员还可以探索使用深度信息或焦点估计的模型。所有数据和预处理代码均在宽松许可下公开,鼓励他人基于该流程扩展数据集或为新算法建立基准。

对未来细胞成像的意义

对非专业读者而言,关键结论是 Light My Cells 提供了教计算机在更温和的显微成像下“看见”细胞所需的原始材料。科学家们或将越来越多地依赖在此类集合上训练的智能软件来显示关键结构的位置,而不是总是添加发光标签并承担损害风险。该数据库本身并不能完全解决无荧光成像的问题,但它向所有人提供了高质量、注释良好的实例,加速了向更少侵入、更可扩展的活细胞观测方式的进展。

引用: Kauffmann, D., Gay, G., Mateos-Langerak, J. et al. 2D Multimodal Image Collection for Fluorescence Prediction from Transmitted Light Microscopy. Sci Data 13, 743 (2026). https://doi.org/10.1038/s41597-026-07004-w

关键词: 荧光显微镜, 透射光成像, 深度学习, 生物图像数据库, 计算机内标注