Clear Sky Science · zh

番茄多角度多姿态数据集用于精细表型分析

· 返回目录

为何番茄与智能相机重要

番茄不仅是沙拉常备食材;它还是世界上最重要的作物之一,也是植物科学的主要研究对象。育种专家和研究人员需要持续详细观察番茄植株——叶片如何生长、花何时开放、水果如何变色——以培育更耐逆、口感更好、适应力更强的品种。然而,这类近距离检查通常依赖肉眼,既耗时又难以复现,且不同观察者之间可能存在差异。本文介绍了 TomatoMAP,这是一个大规模、精心设计的番茄图像集合,能让计算机从多个角度检查植株,减少人工判断的不确定性。

Figure 1
Figure 1.

番茄生长的新图像库

TomatoMAP 是一个面向栽培番茄(Solanum lycopersicum)的综合图像数据集。它包含 68,080 张彩色照片,记录了在温室条件下栽培的 101 棵植株超过五个月的生长过程。与零散的快照不同,每株植株在生长过程中被反复拍摄,覆盖开花、果实着色等不同阶段。每张图像都由专家提供详尽标注:用简单的框标出七类关键感兴趣区域——叶片、花簇、果簇、枝条等——并根据农业学者常用的标准尺度打上生长期标签。在另一组特写图像中,单个花蕾、花朵和果实被精确到像素级别地勾画,便于极为精细的分析。

从各个侧面观察植株

为收集该数据集,研究团队建造了一个专用成像台,结合了旋转台与四台同步相机。受控温室中培养的番茄植株被放置在转盘上,转盘以 30 度为步长旋转完成一整圈。每个步进位置上,位于四个高度和角度的相机同时拍摄,得到同一姿态的多角度视图。在 163 天内,该系统生成了超过 64,000 张中等分辨率图像用于生长阶段分类和器官检测,以及 3,616 张高分辨率特写图用于细致分割。这样的多视角设计保留了三维结构信息——例如叶片的遮挡关系或花果簇的空间排列——这些信息很难通过单张二维图像完整捕捉。

教会计算机读取植株性状

TomatoMAP 不只是一个图片库;它也是现代人工智能的试验平台。团队训练并评估了为温室实时应用而挑选的轻量、快速的计算机视觉模型。一个紧凑的图像分类网络学会了判定植株的生长阶段;一个高效的目标检测模型学会在每帧中定位叶片、花簇和果簇等植株部位。对于特写图像,实例分割模型能描绘单个花蕾、花朵和果实的精确轮廓,并根据尺寸和颜色区分早期与晚期发育阶段。作者展示了这些模型在较大花朵和果实上的高准确率,并且运行速度足以用于连续监测。

Figure 2
Figure 2.

构建分步数字化工作流程

为提高自动表型分析的可靠性,研究者设计了三级“级联”工作流程。首先,数据从简单的整株图像到详细分割按层次组织。其次,模型按链式方式排列:生长阶段分类器决定哪些植株或时间点被传递到检测器,检测器再突出显示供分割模型精炼的最相关区域。最后,所有模型的输出被合并为对每株植株性状的综合描述,例如果实数量及其所处阶段。通过以这种方式结构化数据和模型,错误更不易级联放大,并且每一步都可以在不重建整个系统的情况下改进或替换。

机器与人眼的匹配程度

由于人类专家之间并非总是一致,团队仔细检验了 AI 模型与专家的匹配程度。他们比较了数百张由五位专家独立标注以及由训练好的检测模型标注的图像。使用标准的一致性度量,专家–专家和 AI–专家之间的比较均显示“近乎完美”的一致性。这表明,至少对于本文研究的结构和阶段,被自动方法匹配受过训练的人类观察者的可靠性,同时还能避免疲劳和不一致带来的问题。

对未来作物的意义

TomatoMAP 表明,借助合适的成像装置与细致注释,计算机可以从多个角度详尽跟踪番茄生长,并且其判断能紧密反映专家意见。对于育种者和农户而言,这为更快捷、更客观地筛选新品种和生长条件提供了可能,从评估果负到识别植株结构的细微差异。尽管某些植物器官仍较难完美捕捉,且仍需将模型针对特定设备进行调整,但该数据集为可扩展、减少偏差的数字化表型分析奠定了基础,终有一天可助力将更耐逆、产量更高的作物从温室实验推广到餐桌。

引用: Zhang, Y., Struckmeyer, S., Kolb, A. et al. Tomato Multi-Angle Multi-Pose Dataset for Fine-Grained Phenotyping. Sci Data 13, 309 (2026). https://doi.org/10.1038/s41597-026-06926-9

关键词: 番茄表型分析, 植物成像, 多视角数据集, 农业中的计算机视觉, 作物育种