Clear Sky Science · zh

用于叶片模型 PROSPECT‑D 的机器学习替代模型及其在不同植物物种中的应用

· 返回目录

为何测量叶片光学很重要

农民、生态学家和育种学家都希望了解植物的健康状况、含水量以及用于光合作用的叶面积比例。传统上,要回答这些问题通常需要采摘叶片并进行精密的化学检测。本研究表明,结合高精度的叶片反射光测量与智能计算模型,可以快速且无损地估算许多隐藏的叶片属性,并能在非常不同的植物物种间通用。

Figure 1. 利用叶片的光学指纹和学习模型来跨多种植物估算隐藏的叶片性状。
Figure 1. 利用叶片的光学指纹和学习模型来跨多种植物估算隐藏的叶片性状。

从反射光读取植物健康信息

每片叶子对太阳光的反射与吸收呈现出依赖于色素、叶片内部结构和含水量的模式。现代仪器可以在数百个非常窄的波长上测量这种模式,形成所谓的高光谱指纹。长期以来,研究者要么使用纯统计工具,要么使用基于物理的模型,将这些指纹与叶片性状联系起来。PROSPECT 系列模型属于基于物理的范畴,描述光如何穿过叶片的各层。若已知叶片性状,它可预测叶片的反射光谱;理论上也可以反向运行,从测得的光谱估算这些性状。

在多种植物上检验受信赖的模型

研究团队旨在检验最新版本 PROSPECT‑D 在广泛物种和生长条件下的表现,并使用机器学习构建对其的加速替代模型。他们汇集了九个大型数据集,包含来自玉米、高粱、大豆、油菜(camelina)、热带树木、混合作物以及多样的木本和草本植物的七千多条叶片光谱。对于每条测得的光谱,研究者首先让 PROSPECT‑D 反演以推断六个关键叶片性状,如色素含量、含水量和单位面积干重等。然后他们用这些推断出的性状正演模型,生成一个合成光谱——如果模型准确,该合成谱应与测得谱相匹配。

物理模型困难之处及原因

通过在每个波长上比较测得与模拟的光谱,作者发现 PROSPECT‑D 在可见光和红外的大多数波段上都能非常好地再现叶片反射。主要的不匹配只出现在四个较窄的波段,在这些波段叶片反射极低。对两年生玉米的分析显示,这些问题波段的反射受田间环境变化驱动更强,而非遗传差异,表明测量噪声和环境效应在这些波段占主导。当团队改为从合成光谱出发重复反演和正演步骤时,匹配几乎完美,这表明只要数据处于模型的适用范围内,反演程序本身是非常准确的。

Figure 2. 详细的叶片反射模式如何通过学习到的模型流动,从而生成水分、色素和结构的估算。
Figure 2. 详细的叶片反射模式如何通过学习到的模型流动,从而生成水分、色素和结构的估算。

教机器来替代物理模型

在此基础上,研究者训练了两类数据驱动模型以模拟 PROSPECT‑D。首先,他们使用称为偏最小二乘回归的方法,学习模拟光谱与 PROSPECT‑D 推断出的叶片性状之间的关联。在一种物种上训练的模型随后在其他物种上进行测试。对于与叶片结构、叶绿素、含水量和单位面积干重相关的四个性状,这些模型在大多数数据集中都很好地迁移,尤其是在使用最具多样性的物种集训练时。与类胡萝卜素和花青素相关的两个色素性状则更难跨物种可靠预测,可能因为它们的光谱特征较弱并与叶绿素的信号重叠。其次,团队直接在测得的光谱上训练深度神经网络来预测相同的性状,从而创建出运行完整基于物理反演的快速替代器。

从光谱到性状的一条更快途径

在两个多样植物集合上训练的神经网络能够以接近 PROSPECT‑D 的精度,从测得光谱中恢复四个核心叶片性状,但所需计算时间仅为其一小部分。一种可解释性方法显示,这些网络自然地弱化了那些 PROSPECT‑D 性能较差且噪声较大的波长段,而更多依赖模型与测量一致的光谱区间。尽管两个色素性状仍然具有挑战性,该研究提供了一个实用且可迁移的工具,用于从高光谱反射率估算关键叶片属性,并给出一个识别与修正基于物理的叶片模型弱点的一般框架。

引用: Rahimi-Majd, M., Xu, R., Bauermeister, S. et al. Machine learning surrogate for the leaf PROSPECT-D model and its applications across plant species. Sci Rep 16, 15602 (2026). https://doi.org/10.1038/s41598-026-53899-1

关键词: 叶片高光谱反射率, PROSPECT‑D, 机器学习替代模型, 叶片性状估算, 植物表型分析