Clear Sky Science · zh
用于自动检测与深度学习的临床分离细菌高分辨率菌落图像
为什么培养皿上的小点很重要
在医生检测感染时,通常会将患者样本中的微生物在营养平板上培养,等待被称为菌落的小点出现。每个小点都来自一个单一微生物,其外观和排列有助于实验室人员判断致病来源。但人工目视读取数百块培养皿既慢又容易疲劳。本研究介绍了一个大规模且精心构建的高质量菌落图像集合,旨在帮助计算机学习快速且一致地识别和计数这些小点。

从拥挤的实验台到数字图像
在医院实验室中,工作人员常规地从血液、尿液或呼吸道样本中培养细菌,然后通过观察菌落的大小、颜色和形态来指导诊断和治疗。传统的人工阅读不仅劳动强度大,而且不同人之间结果会有差异,尤其在需要短时间检查大量培养皿时更为明显。随着医疗系统检测人数增加并寻求更快速的结果,正推动从手工检查向能够以一致标准处理大量图像的数字工具转变。
为细菌建立更清晰的窗口
作者旨在建立一个能避免旧数据集常见缺陷(如光照不均和物种数量少)的菌落图像集合。他们在近两年内收集了来自真实患者的临床菌株,涵盖19种重要细菌,包括若干常见耐药菌。对每个物种挑选了多个不同菌株,在严格控制的条件下在固体培养基上培养,有时会等待48小时以让生长缓慢的菌株呈现典型形态。随后,他们使用一个封闭的遮光成像装置,配备固定相机和两个光源——一个透过平板照明、一个从上方反射光——以捕捉每个培养皿的清晰稳定图像。
将培养皿变成计算机可用的数字数据
图像采集完成后,受过培训的实验室人员使用标注软件仔细地为每个菌落绘制边框。两位检查者独立标注菌落,罕见冲突由第三位专家裁定,以确保最终标注与真实菌落边界高度一致。团队还对图像进行了水平或垂直翻转以生成额外样本,并相应调整标注。最终,他们生成了950张原始图像及其翻转版本,共1900张图像,标注的菌落数量达118,442个。标签以多种常见文件格式存储,便于不同的人工智能工具在不做大量额外工作的情况下使用这些数据。

将数据集付诸测试
为了展示数据集的用途,研究人员训练了一个现代目标检测模型来在培养皿上找到菌落,并研究不同物种在图像特征的紧凑映射中如何表现。他们仅使用原始图像,将其划分为训练组和测试组,并在训练过程中采用了混合与遮蔽图像等常见策略。在保留的测试培养皿上,该模型对大多数19种物种都达到了很高的准确率,只有少数对小而微弱、易与背景融合的菌落表现欠佳。当他们将模型对菌落的分组绘制到二维图上时,每种物种形成了清晰的簇,这表明这些图像携带强烈且可区分的视觉特征,计算机能够学习到这些特征。
这对未来实验室工作的意义
这个开放数据集为构建和验证能够自动检测与计数菌落的工具提供了一个干净且丰富的起点,甚至能区分诸如某些细菌周围红色细胞损伤环等细微特征。虽然它侧重于单一物种单独培养,而非真实患者样本中的复杂混合,但它捕捉了菌株之间的自然变异,并在高度可重复的条件下呈现菌落。对普通读者而言,主要结论是:通过将数千张照明良好的培养皿图像转化为共享资源,这项工作使许多团体更容易设计和比较智能系统,这些系统未来可能帮助医院实验室提供更可靠、更快速的感染检测结果。
引用: Du, J., Yang, C., Sun, M. et al. High-Resolution Colony Images of Clinically Isolated Bacteria for Automated Detection and Deep Learning. Sci Data 13, 757 (2026). https://doi.org/10.1038/s41597-026-07095-5
关键词: 细菌菌落, 图像数据集, 自动检测, 深度学习, 临床微生物学