Clear Sky Science · zh

来自阳性血培养的革兰氏染色注释数据集

· 返回目录

为何快速获得感染结果很重要

当细菌或真菌进入血液时,每延误一小时而未给予恰当治疗,可能意味着生死攸关。医生依赖一种名为革兰氏染色的快速实验室检测来判断病原体类型并选择早期抗生素。但读取这些染色的显微镜载玻片是一项需要技能的手工工作,既耗时又可能因技术人员而异。本研究描述了一个新的、经过细致注释的真实医院血培养载玻片图像集合,旨在帮助计算机自动识别革兰氏染色,从而支持更快速、更可靠的护理。

将真实医院载玻片转化为数据

研究人员收集了在日常医院工作中从患者阳性血培养瓶中培养得到的57种不同细菌和真菌。从2024年1月至5月,一旦血培养显示阳性,工作人员在玻片上制备革兰氏染色涂片,并使用一种高精度鉴定方法——MALDI-TOF质谱——确认准确物种。在不改变常规流程或额外采样的情况下,团队随后用100×油镜显微镜拍摄典型视野的高分辨率数字图像,获得了505张大型彩色图像,真实反映了技术人员在实际工作中所见的情形。

Figure 1
Figure 1.

对微小形态的细致标注

为人工智能构建有用的训练集意味着必须准确知道每张图片中每个微生物的位置。两名经验丰富的微生物学技术员在只根据显微镜下观察到的情况的指导下,独立在每幅图像中为单个微生物细胞或簇绘制了边框。一个定制软件工具比较了两组标注:重叠足够的框被合并,任何不一致或分歧都会被标记出来。随后由一位拥有20多年经验的高级专家手工复审这些情况。该多步骤流程产生了7,528条经检查的注释,标注了球菌(圆形细胞)、杆菌(杆状细胞)和真菌,同时省略了部分或可疑对象。

数据集包含的内容

成品资源整合了若干信息层。所有505张图像以高分辨率JPEG文件提供,最终经专家验证的边框以计算机视觉研究中广泛使用的标准COCO JSON格式存储。额外文件将每张图像链接到其微生物物种、革兰氏阳性或阴性、其广义形状类别、所来自的血培养瓶类型以及培养呈阳性所用的时间。由于每张图像仅包含一种物种,因此同一图像内的所有标注具有相同的生物学特性。用户可以选择单个大型注释文件或按图像分别提供的文件,并包含一个简单的Python脚本以可视化任意图像及其覆盖的边框。

Figure 2
Figure 2.

教会计算机识别病原体

为证明数据集不仅整齐而且实用,作者训练了一种现代目标检测算法YOLOv10以在图像中定位并分类微生物。他们将数据分为训练集和验证集,在高端显卡上进行了500轮训练,跟踪模型绘制准确边框和区分不同细胞类型的学习情况。训练后的系统在标准匹配阈值下达到约84.6%的平均精度(mAP),表明它能够可靠地在不同载玻片外观中定位并标注微生物,包括染色强度、背景碎屑和焦距差异等变化。

该资源的潜在用途

由于数据遵循通用格式,它们可以接入许多现有的计算机视觉流程。研究人员可以先训练系统仅将真实微生物与碎屑区分开,帮助实验室筛除假阳性培养信号。他们也可以将微生物分为广义形状,符合临床在早期“一级”报告中对指导初始抗生素选择的需求。更为雄心勃勃的目标是通过细微的视觉线索区分个别物种。作者指出了一些限制:有些细胞成簇,有些载玻片来自单一来源的同一物种,焦距也会有所不同——这正如现实情况一样。然而,每个被包括的边框都经过仔细核查,使该数据集成为一个可靠的起点。

这对患者意味着什么

简而言之,这项工作将日常的血培养载玻片转变为供智能软件共同训练的共享资源。通过公开图像和专家标注,研究降低了全球团队构建和测试能够快速且一致解读革兰氏染色的人工智能工具的门槛。虽然这些系统不会取代人类微生物学家,但它们可以更早地标记危险感染、减少解读错误并支持更合理的抗生素使用。对患者而言,这可能意味着在关键时刻获得更快、更精准的治疗。

引用: Yi, Q., Gou, X., Zhu, R. et al. An annotated dataset of Gram stains from positive blood cultures. Sci Data 13, 294 (2026). https://doi.org/10.1038/s41597-026-06651-3

关键词: 血流感染, 革兰氏染色, 医学影像数据集, 人工智能, 微生物学诊断