Clear Sky Science · zh
用于塑料识别的拉曼光谱(RaSPI)和塑料识别拉曼地图(RaMPI)数据集
为何微小的塑料线索重要
塑料废弃物已遍布全球,从深海到高山,甚至进入了我们的身体内。要了解环境中到底存在多少塑料、它们如何迁移以及可能对健康造成何种影响,科学家需要快速且可靠的方法来判断一小片碎片由何种塑料制成。本文介绍了两套精心构建的测量集合,它们像详细的指纹一样用于塑料识别,旨在帮助研究人员和计算机程序更容易、更准确地辨认塑料碎片。

用彩色光观察塑料
识别塑料的一种强有力方法是用激光照射并记录光的散射情况。这种称为拉曼光谱学的方法会产生由材料分子决定的峰值图谱,类似于条形码。它在湿样或脏样中表现尤其好,因为水对信号干扰较小。迄今为止,许多塑料指纹库基于干净的工厂制样,并使用不同的设置和质量标准,这使得比较结果或训练能在无人干预下处理数千个测量的计算程序变得困难。
建立一套干净的塑料指纹库
第一个新集合称为 RaSPI,收录了来自275件塑料样品的402条高精度光谱。这些样品涵盖14类常见塑料,范围从食品包装和饮料杯到工程材料,既包括商业产品也包括从真实环境污染中取出的碎片。研究团队使用了两种激光波长并记录了广泛的信号范围,以便捕捉细微特征。同时记录了每件样品的颜色、来源和其他备注,因为染料和添加剂会改变光谱模式。每条光谱都以原始形式和清理后的形式共享:去除干扰背景、校正随机亮尖峰,并将数据放到通用网格上,使不同光谱在后续分析中能整齐对齐。
在二维上绘制塑料微粒的分布图
第二个集合 RaMPI 侧重于塑料微粒在表面上的分布,类似于载玻片上散落的尘埃。研究人员通过用激光扫描混合物并在每个点记录光谱,制作了34幅微小的地图。这些地图共包含超过33,000条光谱,大约一半来自塑料,一半来自空白背景。测量使用一种激光波长,信号范围较窄,但采用了多种激光功率和曝光时间设置。这样的刻意变化生成了从非常干净到相当嘈杂的数据,反映了科学家在湖泊、海洋和城市真实样品中遇到的质量不均情况。
教计算机解读这些信号
为使这些地图真正可用,团队对每一条光谱进行了人工标注,标记为14种塑料类型之一或为空白。然后通过计算信噪比并确认处理步骤未扭曲整体形状,来检查数据的技术质量。作为实用测试,他们用 RaSPI 的光谱训练了一个简单的计算模型,并让它对所有 RaMPI 地图点进行分类。模型的结果与人工标签在多幅地图上高度一致,表明 RaSPI 的指纹与 RaMPI 的地图相互一致,适合用于开发和验证基于计算的识别工具。

这些数据集对塑料污染意味着什么
对于关心环境中塑料的人来说,这些数据集并非直接的健康研究,而是一个共享的工具箱。通过提供开放且文档详尽的日常塑料指纹,包括含有未知添加剂的风化碎片,RaSPI 和 RaMPI 集合为研究人员和软件开发者提供了共同的基础。有了更好的训练材料,计算机可以更快、更少依赖人工地识别和分类塑料碎片。反过来,这能加速对水体、土壤和空气中塑料污染的调查,帮助科学家和决策者更清晰地了解塑料的去向及问题的严重程度。
引用: Hogan, Ú.E., Voss, H.B., Lei, B. et al. Raman spectra for plastics identification (RaSPI) and Raman maps for plastics identification (RaMPI) datasets. Sci Data 13, 765 (2026). https://doi.org/10.1038/s41597-026-07103-8
关键词: 微塑料, 拉曼光谱学, 机器学习, 环境污染, 光谱数据集