Clear Sky Science · zh

AIR-LEISH:用于基于人工智能的利什曼原虫胞内体检测的吉姆萨染色显微图像数据集

· 返回目录

微小寄生虫与智能相机为何重要

利什曼病是一种由寄生虫传播的疾病,悄然影响着数以百万计的人,主要集中在低收入地区。医生和研究人员仍然高度依赖在显微镜下观察经染色的血液或组织涂片,以在免疫细胞内发现寄生虫——这是一个既费时又需要专业训练的繁琐过程。本文介绍了AIR-LEISH,这是一个可免费获取的显微图像集合,旨在让计算机学会自动识别这些寄生虫,从而为更快速、更便宜且更可靠的诊断与药物研究工具打开大门。

Figure 1
Figure 1.

从蠓虫叮咬到隐匿入侵者

利什曼病通过受感染的蠓虫叮咬传播,可引起皮肤溃疡或威胁生命的内脏感染。寄生虫在被称为巨噬细胞的白细胞内生存并繁殖,以一种微小的球形形态存在,称为胞内体(amastigote)。为评估病情严重程度或潜在疗法的疗效,研究人员必须计数这些藏在细胞内的寄生虫数量。分子实验室检测可以发现寄生虫DNA,但在许多医院和研究实验室——尤其是资源匮乏的环境中——普通光学显微镜仍是主要手段。然而,人工计数寄生虫既慢又容易疲劳,且不同观察者之间可能存在差异。

为人工视觉构建训练集

人工智能已展示出在医学图像中发现人眼难以察觉或难以大规模处理的细微模式的能力。但要做到这一点,AI系统需要成千上万经精确标注的示例。迄今为止,针对利什曼病的此类图像集合稀少、不完整或难以获取——尤其是对临床重要的细胞内胞内体阶段。作者创建了AIR-LEISH以填补这一空白:收录了180张高分辨率吉姆萨染色的人类巨噬细胞感染显微图像,使用常规研究显微镜上安装的普通智能手机拍摄。每张图片展示来自两种不同感染设置的细胞,涉及不同的寄生虫物种与宿主细胞类型,从而涵盖了广泛且现实的外观变异。

将原始图片转化为可靠的真实标签

为了让这些图像对计算机有用,每个细胞与寄生虫都必须手工描绘与标注。寄生虫学专家首先使用专用标注工具描出单个巨噬细胞、细胞核和微小胞内体的轮廓。随后由一位AI工程师逐像素精修这些标注,以确保形状和边界精确,包括小型或重叠的寄生虫。团队检查了不同标注者之间的一致性,发现高度一致,表明这些标签可以作为可信的真实标签。总体上,该数据集包括8,140个寄生虫、1,511个宿主细胞和1,731个细胞核,以及单独的掩码图像,明确告诉算法哪些像素属于哪种结构。

让AI模型接受考验

为了展示AIR-LEISH的应用潜力,研究人员训练了两种广泛使用的图像分析系统。一种名为U-Net,旨在对每个像素进行分类,判断其属于背景、寄生虫、细胞体或细胞核。另一种YOLOv8则在检测到的每个对象周围绘制矩形框并进行计数。尽管寄生虫体积小且图像数量有限,两种模型在发现并将寄生虫与宿主细胞分离方面都表现良好,取得了较高的准确性和可靠性评分。模型甚至能在一百多个大多未被感染的细胞中识别出单个被感染细胞,显示出其未来在高度敏感筛查中的潜在支持能力。

Figure 2
Figure 2.

为更好护理与新疗法开启通路

通过在Zenodo平台上公开发布AIR-LEISH及其代码和详细文档,作者为全球许多团队——尤其是资源有限的团体——提供了一个实用的基础,以建立和比较用于利什曼病的AI工具。由于图像同时包含宿主细胞及其细胞核,该数据集还能支持更广泛的细胞计数、感染水平研究,甚至其他在类似免疫细胞内寄生的病原体研究。简而言之,这项工作把专家在显微镜下数小时的工作转化为可重复使用的数字资源,助力加速诊断、药物发现,最终推动对这一被忽视但严重疾病的抗争。

引用: Oualha, R., Fekih-Romdhane, N., Driss, D. et al. AIR-LEISH: A Dataset of Giemsa-Stained Microscopy Images for AI-based Leishmania amastigotes Detection. Sci Data 13, 328 (2026). https://doi.org/10.1038/s41597-026-06676-8

关键词: 利什曼病, 显微镜图像, 医学影像人工智能, 寄生虫检测, 传染病诊断