Clear Sky Science · fr
ResSeMo : intégration de réseaux neuronaux convolutifs profonds pour une classification des déchets à haute précision et un traitement efficace
Pourquoi il est important de trier les déchets avec de l’intelligence
Chaque jour, des villes du monde entier sont confrontées à des montagnes d’ordures mélangées. Lorsque bouteilles, canettes, restes alimentaires et piles se retrouvent dans la même poubelle, il devient plus difficile et plus coûteux de les recycler de manière sûre. Cet article présente ResSeMo, un nouveau système de vision par ordinateur qui apprend aux machines à reconnaître rapidement et de façon fiable différents types de déchets, même dans des scènes de rue réelles, contribuant ainsi à des quartiers plus propres et à un recyclage plus performant.

La pile croissante des déchets urbains
L’urbanisation a fortement augmenté la quantité de déchets produite. Les méthodes de tri traditionnelles reposent sur des opérateurs et des machines simples qui mal classent souvent plus d’un quart des déchets qu’ils traitent. Cela signifie que des matériaux de valeur sont enfouis ou brûlés au lieu d’être réutilisés, et que des éléments dangereux comme les piles passent à travers. Les chercheurs se sont tournés vers la reconnaissance d’images moderne, où des caméras et des algorithmes examinent des photos de déchets et déterminent si un objet est en verre, plastique, papier, métal ou autre. Pourtant, de nombreux systèmes existants sont soit lents et lourds, soit efficaces uniquement dans des conditions propres et contrôlées de laboratoire, pas sur des trottoirs encombrés ou à l’intérieur de poubelles pleines.
Un nouveau cerveau en trois parties pour les déchets
ResSeMo aborde ce problème en combinant trois types de modules de réseau neuronal en un « cerveau » coordonné. La première partie se spécialise dans la détection de riches détails visuels à plusieurs échelles, tels que la texture, les contours et la brillance, pour distinguer par exemple une bouteille en verre d’une bouteille en plastique. La deuxième partie agit comme un projecteur, renforçant les indices visuels les plus importants — marques de corrosion sur le métal ou motifs typiques de piles — tout en atténuant les arrière-plans distrayants. La partie finale se concentre sur l’exécution de tout cela avec beaucoup moins de calculs, permettant au système de fonctionner sur de petits dispositifs comme des poubelles intelligentes ou des capteurs à faible consommation, sans occuper beaucoup de mémoire ni d’énergie. Ensemble, elles forment un pipeline étape par étape qui transforme des images en désordre en décisions de catégorie fiables.
Entraînement sur des déchets du monde réel
Pour évaluer ResSeMo, les auteurs ont utilisé deux grandes collections d’images. La première, TrashNet, contient quelques milliers de photos prises dans des contextes simples où chaque objet est net et centré. La seconde, TACO, est beaucoup plus grande et plus proche de la réalité, remplie de détritus éparpillés dans les rues, les parcs et les coins intérieurs, souvent petits, partiellement cachés ou mal éclairés. L’équipe a soigneusement préparé ces données : elle a harmonisé les étiquettes de catégorie entre les deux sources, augmenté le nombre d’exemples avec des techniques classiques comme la rotation et les variations de luminosité, et agrandi les régions d’image autour des très petits objets tels que les bouchons pour les rendre plus visibles pour le modèle. Ils ont aussi ajouté des étiquettes supplémentaires décrivant le degré de saleté et l’encombrement de chaque objet, afin de soutenir une analyse ultérieure de la manière dont les choix de tri pourraient affecter la chaîne de traitement des déchets.

Mise à l’épreuve du modèle
ResSeMo a été comparé à dix réseaux bien connus, incluant des modèles lourds souvent utilisés en recherche et des versions plus légères conçues pour les téléphones. Sur les photos plus simples de TrashNet, le nouveau système a correctement classé un peu plus de neuf objets sur dix tout en utilisant beaucoup moins d’opérations de calcul que les concurrents les plus puissants. Sur les images plus exigeantes de TACO, il a tout de même reconnu près de 87 % des objets correctement tout en maintenant des temps de traitement courts. Le modèle s’est également bien comporté dans des conditions difficiles : lorsque les chercheurs ont ajouté du bruit, du flou, de l’obscurité, de l’éblouissement ou des effets météorologiques simulés, la précision de ResSeMo n’a chuté que modestement et est restée supérieure à celle des modèles rivaux. Des tests supplémentaires sur des petites cartes comme la NVIDIA Jetson Nano et le Raspberry Pi ont montré qu’une version compressée pouvait fonctionner avec une faible consommation d’énergie et peu de mémoire, la rendant adaptée aux dispositifs embarqués sur le terrain.
Ce que cela signifie pour la vie quotidienne
En termes simples, ResSeMo montre qu’il est possible de construire un système de tri des déchets à la fois perspicace et pratique. En combinant une reconnaissance de motifs puissante avec une conception adaptée au matériel petit et peu énergivore, l’approche aide à combler le fossé entre la recherche et les poubelles réelles dans les rues. Bien que des travaux supplémentaires soient nécessaires pour gérer les types de déchets rares ou des conditions extrêmes, cette étude démontre une voie prometteuse pour les villes qui souhaitent automatiser le tri de première ligne, récupérer davantage de matériaux et empêcher les objets dangereux d’atteindre les décharges et les incinérateurs.
Citation: Liu, T., Li, B. & Wang, Z. ResSeMo: deep convolutional neural network integration for high-accuracy waste classification and efficient processing. Sci Rep 16, 15167 (2026). https://doi.org/10.1038/s41598-026-45814-5
Mots-clés: classification des déchets, apprentissage profond, recyclage intelligent, IA en périphérie, assainissement urbain