Clear Sky Science · zh

用于应用特征选择和机器学习技术以估算与管理小龙虾种群的示例模型

· 返回目录

为什么现在数小龙虾需要智能工具

随着全球对海鲜需求的增长,管理者面临在保持野生资源健康的同时保障食物供给的双重压力。小龙虾是一种营养丰富、脂肪含量低的美味,可在相对温和的用水条件下养殖,但疾病、过度捕捞和污染使其数量变得更难预测。本研究展示了如何借用来自人工智能的现代数据技术,将对小龙虾的简单体测转化为关于其生长、可食用肉量和种群规模的有力线索——从而帮助渔业在盈利与可持续之间取得平衡。

Figure 1
Figure 1.

小龙虾作为未来食物来源

小龙虾蛋白质和必需矿物质含量高,同时脂肪和热量低,在高质量动物蛋白稀缺或价格昂贵的地区具有吸引力。它们还能耐受多种环境条件,可在鱼塘、水库甚至稻田中以相对较低的投入进行养殖。与此同时,全球气候变化和人口增长预计将在未来几十年内大幅推高食物需求。鉴于小龙虾种群已因疫情、过度捕捞和水体污染出现波动,迫切需要更好的工具来跟踪其状态并在不耗竭这一宝贵资源的前提下制定捕捞计划。

将现场测量转为有用数据

研究者聚焦于土耳其阿提基萨尔水库(Türkiye’s Atikhisar Reservoir)的大型小龙虾群体,采集了6,470只窄爪小龙虾的详细测量数据。对每只个体记录了20个特征,包括总体长度、关键体部的宽度和长度、头部、腹部与螯的重量,以及可食用的肉重等。这些测量使用精确的卡尺和天平完成,随后采用简单的平均法填补缺失值并进行清理。团队还应用了渔业中经典的长重关系公式,检查总长与总重的关系并验证动物随时间的生长模式。

找出最有信息量的体貌特征

并非每个测量都提供有用信息,额外的、与目标弱相关的特征会拖慢或干扰计算模型。为从噪声中筛选信号,作者使用了一种统计工具,对每个特征与总重的关联强度进行评分。他们只保留那些显示出至少中等相关性的测量,例如总长度、头部长度与宽度、腹部长度与宽度,以及各部位和肉重。此步骤大幅减少了模型需要考虑的输入数量,同时保留了描述小龙虾体重所需的几乎全部信息。

Figure 2
Figure 2.

让算法从渔获中学习

在掌握了最重要的特征后,团队训练了几种常见的预测方法,这些方法都属于机器学习范畴。研究以70%的数据用于训练、30%用于测试,比较了各方法从体测数据估计单只小龙虾总重的能力。在雌性、雄性及总体样本中,三种方法——多元线性回归、随机森林,尤其是梯度提升法——始终产生了非常准确的预测,误差相对于数据的自然变异来说很小。另一种广泛使用的方法支持向量回归表现较弱,因为它难以捕捉这些动物体长与体重之间微妙的非线性关系。

这对未来渔业意味着什么

对于非专业读者,主要结论是:将小龙虾的简单体测与精心选择的机器学习工具结合,能快速且可靠地估算种群中可收获肉量。研究发现水库中的小龙虾呈现出一种随长度增长体重增速稍快的生长形式,而以精选特征为输入的梯度提升模型能近乎完美地预测这一模式。实际上,这意味着管理者可以在不称重每一只个体的情况下估算资源规模并设计捕捞规则,从而节省时间与成本并降低过度捕捞的风险。随着类似方法在其他物种上的推广,像这样的数据驱动模型有望成为可持续水产养殖与野生种群管理的基石。

引用: Gültepe, Y., Gültepe, N. A sample model for applying feature selection and machine learning techniques to estimate and manage crayfish populations. Sci Rep 16, 14540 (2026). https://doi.org/10.1038/s41598-026-45535-9

关键词: 可持续渔业, 小龙虾养殖, 机器学习, 资源评估, 特征选择