Clear Sky Science · zh

ResSeMo：用于高精度垃圾分类与高效处理的深度卷积神经网络整合

2026-03-26 · 返回目录

为何用智能化手段分拣垃圾很重要

每天，世界各地的城市都在应对成堆的混合垃圾。当瓶子、易拉罐、餐厨残渣和电池混在同一个垃圾桶时，回收它们既更困难又更昂贵。本文介绍了 ResSeMo，一套新的计算机视觉系统，教会机器在真实街头场景中快速且可靠地识别不同种类的垃圾，助力更清洁的社区与更高效的回收。

Figure 1. 智能视觉系统将城市混合垃圾转化为整齐的回收流，便于更安全的处理。

不断增长的城市垃圾堆

城市化显著增加了人们产生的垃圾量。传统的分拣方式依赖人工和简单机械，往往会错分超过四分之一的垃圾。这意味着有价值的材料被掩埋或焚烧而非再利用，危险物品如电池也可能被漏掉。研究者转向现代图像识别，通过摄像头和算法分析垃圾照片，判断物品是玻璃、塑料、纸张、金属还是其他。然而，许多现有系统要么运行缓慢且计算量大，要么只在干净受控的实验条件下表现良好，无法应对杂乱的人行道或装满的垃圾桶。

用于垃圾的三合一智能结构

ResSeMo 通过将三类神经网络模块组合成一个协同“脑”来应对这一问题。第一部分擅长在多尺度上捕捉丰富的视觉细节，如纹理、轮廓和光泽，从而区分玻璃瓶与塑料瓶。第二部分像聚光灯一样增强最重要的视觉线索，例如金属的腐蚀痕迹或电池的典型图案，同时弱化干扰背景。最后一部分注重以更少的计算实现上述功能，使系统能在智能垃圾桶或低功耗传感器等小型设备上运行，而不会占用大量内存或能量。三者协同形成一个逐步管道，将杂乱的图像转化为自信的类别判断。

在真实世界垃圾上的训练

为测试 ResSeMo，作者使用了两个主要图像集合。第一个 TrashNet 包含数千张在简单场景中拍摄的照片，每个物体清晰且居中。第二个 TACO 更大且更贴近现实，充满散落在街道、公园和室内角落的垃圾，通常体积很小、部分被遮挡或光线不好。团队对这些数据进行了细致准备：他们在两个来源之间对齐类别标签，使用旋转与亮度变化等常规手段扩充样本数量，并放大诸如瓶盖等非常小的物体的图像区域以便模型更易识别。他们还增加了描述物品脏污程度和体积大小的额外标签，以支持后续分析分拣决策如何影响更广泛的垃圾处理链。

Figure 2. 逐步展示一个紧凑型 AI 如何筛选垃圾图像，以准确区分不同废物类型。

将模型付诸测试

ResSeMo 与十个知名网络进行了对比，其中包括研究中常用的重量级模型和为手机设计的轻量级模型。在较为简单的 TrashNet 照片上，新系统在正确分类方面略高于十分之九，同时所需计算步骤远少于最强的竞争者。在更具挑战性的 TACO 图像上，它仍能正确识别近 87% 的物品且保持较短的处理时间。该模型在苛刻条件下也表现稳健：当研究人员加入噪声、模糊、昏暗、眩光或模拟恶劣天气时，ResSeMo 的准确率仅小幅下降，并始终高于对手模型。对 NVIDIA Jetson Nano 和树莓派等小型开发板的进一步测试表明，经压缩后的版本可在低功耗和有限内存下运行，适合部署到现场嵌入式设备。

这对日常生活意味着什么

简单来说，ResSeMo 表明可以构建既敏锐又实用的垃圾分拣系统。通过将强大的模式识别能力与适合小型低功耗硬件的设计相结合，这一方法有助于缩小研究与真实街道垃圾桶之间的差距。虽然仍需更多工作来处理罕见垃圾类型或极端情况，但该研究为希望自动化前端分拣、回收更多材料并将有害物质阻隔在填埋或焚烧之外的城市提供了一条有前景的路径。

引用: Liu, T., Li, B. & Wang, Z. ResSeMo: deep convolutional neural network integration for high-accuracy waste classification and efficient processing. Sci Rep 16, 15167 (2026). https://doi.org/10.1038/s41598-026-45814-5

关键词: 垃圾分类, 深度学习, 智能回收, 边缘 AI, 城市环卫