Clear Sky Science · zh

用于预测塔玛尼草牧场粗蛋白含量的机器学习模型

· 返回目录

智能牧场为何与餐桌息息相关

牛肉和牛奶都始于草地。全球范围内,数十亿公顷牧场为牛、羊及其他放牧动物提供饲料。为了让这些动物良好生长并保持健康,草料必须含有足够的蛋白质——这是肌肉、奶类和重要器官的关键构成要素。但测定草中的蛋白通常需要剪取样本并送到实验室检测——既慢又昂贵,大多数农场难以频繁进行。本研究探讨如何将简单的田间可测信息与现代计算技术相结合,快速且低成本地估算草料蛋白含量,帮助农户在使用更少资源的前提下微调放牧和施肥策略。

聚焦一种热带主力牧草

研究者把焦点放在塔玛尼草(Tamani),这是一种在巴西广泛用于密集放牧的高产热带牧草。研究历时18个月,监测了一个0.96公顷的牧场,该牧场被划分为小围栏,并施以两档氮肥水平与两种基于植株截留光量的放牧策略。记录了易于获得的信息:季节、气温、降雨、日照、每个围栏在放牧间隔的休牧时间,以及动物放牧前后的草高。同时,他们采集了有限数量的叶片样本,并采用专门的光学方法测量粗蛋白,构建了一个小而详尽的数据集,将日常管理与草料质量联系起来。

Figure 1
Figure 1.

教计算机“读懂”牧场

团队没有依赖卫星影像或无人机等需要特殊设备和计算资源的方法,而只使用了“表格型”数据——类似电子表格中看到的数据类型。他们测试了五种不同的机器学习方法,这些方法通过示例学习模式:一种标准的线性模型、一种基础决策树、一种类神经网络模型,以及两种流行的基于树的集成方法,它们通过组合许多简单模型来强化预测能力。他们用80%的测量数据来训练模型,保留剩下的20%用于测试。目标很实际:在仅使用农户易于记录的信息——施肥量、休牧期、草高和基础气象数据——的情况下,计算机能否预测叶片中的蛋白含量?

管理选择如何塑造蛋白含量

模型显示,牧场的管理方式对蛋白含量的影响大于本研究记录的气象条件。在所有因素中,放牧间隔时间最为关键:较长的休牧期会导致植株更老、更纤维化且蛋白较低,而较短的间隔有助于维持更嫩、更叶片化且蛋白更高的草。氮肥也起到重要作用,因为氮是植物蛋白和叶绿素的核心成分。放牧前后草高的重要性位居其后,将蛋白含量与动物放养强度联系起来。降雨、温度、日照和季节标记仍有一定影响,但它们的影响力低于这些日常管理决策。

Figure 2
Figure 2.

计算机预测有多准?

表现最好的方法是两种先进的基于树的模型。一种称为随机森林(Random Forest),另一种为XGBoost,它们在预测值与观测值之间展现出相似的相关性,意味着其估计值随真实值的升降而同步变化。总体上XGBoost表现略好,能解释蛋白含量变化的一半多一点,并将平均预测误差控制在约一个半百分点左右。虽然这并非完美,但对于许多管理决策而言已足够有用,尤其是考虑到它仅依赖大多数农场可以用基础工具和笔记本或简单应用记录的信息。

这对农户与食品消费者意味着什么

对普通读者而言,信息很直接:通过密切关注牧场的休牧时长、动物进入离开时的草高以及施用的氮肥量,农户可以朝着理想方向调控草料的蛋白含量。本研究表明,可负担且易采集的测量数据,配合智能算法,可在无需持续实验室检测或昂贵传感设备的情况下快速估算草料蛋白。若未来更大规模和更多样化的数据集证实这些结果,此类工具可帮助农户以更少投入、更低成本和更好的环境效益产出更多肉类和奶类——这些效益最终通过更高效、更可持续的畜牧生产传递到消费者手中。

引用: Oliveira de Aquino Monteiro, G., dos Santos Difante, G., Baptaglin Montagner, D. et al. Machine learning models for crude protein prediction in Tamani grass pastures. Sci Rep 16, 5805 (2026). https://doi.org/10.1038/s41598-026-36949-6

关键词: 牧场管理, 饲草质量, 机器学习, 粗蛋白, 精准畜牧