Clear Sky Science · fr

Modèles résiduels profonds et CNN hybrides pour une classification des déchets en conditions réelles avec prise en compte de la confiance pour une gestion durable des déchets

· Retour à l’index

Pourquoi un tri des déchets plus intelligent importe

La vie moderne génère des montagnes d’ordures, et une grande partie finit au mauvais endroit. Lorsque des matières recyclables sont enterrées en décharge ou que des restes alimentaires sont mélangés à des métaux et des plastiques, nous perdons des ressources précieuses et créons de la pollution et des gaz à effet de serre. Cette étude examine comment une intelligence artificielle avancée fondée sur l’imagerie peut reconnaître automatiquement différents types de déchets dans les conditions désordonnées d’une vraie décharge, afin de rendre le recyclage plus rapide, plus sûr et bien plus fiable que le tri manuel seul.

Figure 1
Figure 1.

Des décharges réelles, pas des photos propres de laboratoire

La plupart des recherches antérieures sur le tri automatisé des déchets se sont appuyées sur des images propres et soigneusement mises en scène : une seule bouteille centrée sur un fond uni, ou des tas de papier et de verre bien rangés. En revanche, les auteurs travaillent avec le jeu de données RealWaste, une collection de milliers de photos couleur prises dans une véritable usine de gestion et de recyclage des déchets en Australie. Chaque image peut contenir des objets déformés, superposés ou sales reposant sur un béton rugueux : tubes en carton, restes alimentaires, verre brisé, papier chiffonné, bouts de métal, contenants en plastique et pièces textiles. Ces images sont regroupées en neuf grandes catégories qui correspondent à la façon dont les installations trient réellement les déchets au premier stade, comme le papier, le plastique, le métal, les matières organiques alimentaires et la végétation. Cet accent sur les scènes authentiques rend le système final beaucoup plus pertinent pour les opérations du monde réel.

Nettoyer l’image avant de prendre une décision

Parce que les images brutes sont si encombrées, l’équipe commence par les « nettoyer » en combinant plusieurs techniques de segmentation d’image. Plutôt que de se fier à une seule méthode, ils appliquent quatre approches différentes pour séparer les objets au premier plan de l’arrière-plan, chacune étant réglée pour repérer différents indices visuels comme le contraste, l’éclairage ou les regroupements de couleurs. Les résultats sont fusionnés de sorte que seules les régions approuvées par plusieurs méthodes sont conservées comme éléments susceptibles d’être des déchets. Une étape supplémentaire dissocie ensuite les objets qui se touchent ou sont empilés. Cela produit un masque affiné qui met en évidence uniquement les déchets tout en atténuant les textures perturbatrices du sol et des environs. L’image originale est alors filtrée par ce masque afin que les réseaux neuronaux voient principalement les déchets eux-mêmes, et non le bruit environnant.

Des réseaux profonds et des modèles hybrides apprennent à voir les déchets

Par-dessus ce prétraitement, les chercheurs ajustent finement un large éventail de réseaux de reconnaissance d’images modernes, appelés réseaux de neurones convolutionnels. Ceux-ci incluent des architectures populaires telles qu’Inception, DenseNet, VGG, EfficientNet, MobileNet et plusieurs versions de ResNet. Parmi eux, un modèle très profond nommé ResNet101 se distingue, atteignant près de 99 % de précision et un score F1 tout aussi élevé sur les données RealWaste. Pour aller plus loin, les auteurs construisent des modèles « hybrides » qui fusionnent les cartes de caractéristiques internes de deux réseaux différents — par exemple en combinant la capacité de ResNet101 à traiter les textures et la structure avec l’aptitude d’InceptionV3 à examiner les objets à plusieurs échelles. Ces hybrides se révèlent particulièrement utiles pour des catégories difficiles comme les textiles et les déchets divers, où les objets peuvent être froissés, déchirés ou partiellement cachés.

Vérifier non seulement ce que le modèle prédit, mais aussi son degré de certitude

Au-delà de la précision brute, l’étude pose une question cruciale pour tout système destiné à fonctionner dans une usine ou un centre de tri urbain : quelle est la confiance du modèle pour chaque décision ? Pour chaque prédiction, le réseau produit un score de confiance compris entre 0 et 1, indiquant à quel point il estime qu’un objet appartient à une classe donnée. Les auteurs analysent la distribution de ces scores sur des milliers d’images de test. Ils constatent que pour des catégories visuellement distinctes comme la végétation, les contenants en plastique et les matières organiques alimentaires, aussi bien le meilleur modèle unique que le meilleur modèle hybride prédisent généralement avec une très grande confiance, souvent au‑dessus de 0,95. Les catégories plus confuses présentent une gamme de scores plus large, signalant où des contrôles humains supplémentaires ou un meilleur jeu de données d’entraînement pourraient être nécessaires. Ils montrent aussi que l’ajout de l’étape de segmentation avant la classification améliore de manière mesurable tous les indicateurs clés de performance, de la précision au score F1.

Figure 2
Figure 2.

Vers des systèmes de gestion des déchets plus fiables et durables

En termes simples, l’article démontre qu’une combinaison soigneusement conçue de nettoyage d’image, d’apprentissage profond et de conception de modèles hybrides peut reconnaître les déchets réels avec une fiabilité remarquable, même lorsque les objets sont sales, superposés ou de forme étrange. ResNet101 apparaît comme une architecture de référence puissante, tandis que les modèles hybrides apportent une force supplémentaire pour les matériaux les plus difficiles à repérer. En associant à chaque décision un score de confiance pertinent, le système ne se contente pas de trier les déchets : il signale aussi quand il peut être incertain, ouvrant la voie à une automatisation plus sûre. Si des travaux supplémentaires sont nécessaires pour réduire la taille des modèles pour de petits appareils et les tester dans des installations à grande échelle et en temps réel, cette recherche jette une base solide pour un tri intelligent des déchets qui peut aider les villes à recycler davantage, envoyer moins en décharge et réduire le fardeau environnemental de nos déchets quotidiens.

Citation: Kumar, Y., Bhardwaj, P., Malhotra, S. et al. Deep residual and hybrid CNN models for confidence-aware real-world waste classification for sustainable waste management. Sci Rep 16, 10424 (2026). https://doi.org/10.1038/s41598-026-41001-8

Mots-clés: classification des déchets, apprentissage profond, vision par ordinateur, systèmes de recyclage, gestion durable des déchets