Clear Sky Science · fr

Modèle vision‑langage informé par le domaine pour un fret durable : classification des groupes motopropulseurs et des cargaisons des camions de drayage

· Retour à l’index

Des ports plus propres, des camions plus intelligents

Les ports déplacent les marchandises qui remplissent nos magasins, mais les camions de courte distance qui transportent les conteneurs à l’entrée et à la sortie des terminaux sont aussi de gros pollueurs. Cette étude montre comment une nouvelle forme d’intelligence artificielle peut surveiller ces camions de « drayage » à l’aide de caméras routières et déterminer automatiquement lesquels utilisent encore du diesel et lesquels ont recours à des technologies plus propres — sans aucun étiquetage manuel des images. Ce type d’observation automatisée pourrait aider les régulateurs, les planificateurs et les communautés locales à suivre les progrès vers un air plus sain autour de certains des ports les plus fréquentés du monde.

Pourquoi les camions portuaires comptent pour le climat et la santé

Aux États‑Unis, les transports constituent la principale source de gaz à effet de serre, et les poids lourds pèsent bien au‑delà de leur nombre : ils représentent une petite part du parc mais une grande part des émissions. Nulle part cela n’est plus visible qu’autour des ports de Los Angeles et de Long Beach, deux havres voisins qui gèrent ensemble environ 40 % des importations de conteneurs américaines et qui sont aussi la plus importante source fixe de pollution de l’air en Californie du Sud. Les camions de drayage — les ensembles qui déplacent les conteneurs entre ports, triages ferroviaires et entrepôts — génèrent une grande partie de cette pollution malgré des trajets relativement courts et prévisibles. La Californie a donc ordonné qu’à l’horizon 2035, tous les camions de drayage portuaire soient zéro‑émission, reposant sur des batteries électriques, des piles à combustible à hydrogène ou des gaz plus propres plutôt que sur le diesel conventionnel.

Figure 1
Figure 1.

Voir ce qui alimente un camion et ce qu’il transporte

Pour savoir si ces politiques fonctionnent, les autorités doivent mesurer quelles sortes de camions se présentent réellement aux portails et sur les routes : sont‑ils diesel ou électriques ? Transportent‑ils un conteneur plein, un châssis vide ou aucun semi‑remorque ? Traditionnellement, répondre à ces questions exige de constituer de grandes collections d’images étiquetées à la main et d’entraîner des modèles spécifiques à chaque tâche. Les auteurs proposent une voie différente, appelée ZeroDray, qui utilise un modèle vision‑langage — un système d’IA capable de comprendre à la fois des images et du texte — sans entraînement supplémentaire. Le modèle reçoit des images de caméras routières montrant des camions passant le long d’un corridor desservant les ports de Los Angeles et Long Beach et doit classer à la fois le groupe motopropulseur (diesel, électrique, gaz naturel comprimé ou hydrogène) et la configuration de la cargaison (conteneur simple de 20 pieds, équivalent 40 pieds plus long, châssis vide, ou camion « bobtail » sans remorque).

Apprendre à l’IA à raisonner comme un expert en camions

Tel quel, les modèles vision‑langage sont des généralistes : ils savent un peu de tout provenant d’Internet mais manquent de connaissances approfondies sur des sujets de niche comme le drayage. ZeroDray comble cette lacune en fournissant au modèle des prompts soigneusement conçus qui codent des indices d’expert. Pour les groupes motopropulseurs, les prompts décrivent des indices visuels tels que les colonnes d’échappement et les grands réservoirs de carburant pour le diesel, les réservoirs cylindriques pour le GNC, les réservoirs d’hydrogène pour les camions à pile à combustible, ou l’absence de dispositifs d’échappement et les badges EV pour les véhicules électriques. Pour la cargaison, les prompts demandent au modèle de raisonner sur la géométrie de la scène : la longueur du conteneur dépasse‑t‑elle nettement sa hauteur et la longueur de la cabine, comme pour une charge de 40 pieds, ou est‑elle plus proche, comme pour un conteneur plus court de 20 pieds ? En demandant à l’IA de passer en revue ces indices étape par étape et d’expliquer son raisonnement en langage clair, le cadre rend ses décisions plus transparentes et plus faciles à vérifier.

Figure 2
Figure 2.

Tester le système sur le trafic réel du port

Les chercheurs ont évalué ZeroDray sur 443 images de camions capturées sur deux jours en février 2025 par une caméra fixe en bord de route près des ports. Des observateurs humains ont fourni des étiquettes de référence pour le groupe motopropulseur et la configuration de la cargaison de chaque camion. Ils ont ensuite comparé ZeroDray à une configuration plus simple qui ne fournissait que les noms de classes bruts au même modèle sous‑jacent. Avec un guidage minimal, le système basique reconnaissait déjà certains cas simples, comme les camions diesel sans remorque. Mais il peinait fortement lorsque les distinctions dépendaient de faibles différences visuelles ou de la disposition spatiale, confondant souvent tracteurs diesel et électriques ou mélangeant conteneurs courts et longs. Une fois les indices visuels informés par des experts et les règles spatiales ajoutés, la précision a bondi de manière spectaculaire. La classification des groupes motopropulseurs a atteint environ 100 % sur diesel, électrique, hydrogène et GNC. La reconnaissance de la cargaison, en particulier la distinction délicate entre longueurs équivalentes simples et doubles, est passée d’environ moitié correct à près de 98 %. Globalement, sur les 11 catégories combinées groupe motopropulseur‑cargaison, le cadre ZeroDray amélioré a obtenu un score F1 moyen de 99 %, dépassant de loin l’approche basique.

Ce que cela signifie pour des corridors de fret plus propres

Pour les non‑spécialistes, l’essentiel est qu’une IA à usage général, correctement guidée par des indices d’expert, peut de manière fiable « regarder » des vidéos routières et dire non seulement comment les camions sont chargés, mais aussi ce qui les alimente — sans entraînement coûteux et personnalisé. Cette capacité pourrait fournir aux autorités portuaires et aux régulateurs un nouvel outil puissant pour surveiller la transition du diesel vers les camions de drayage zéro‑émission, repérer où les nouvelles stations de recharge ou d’hydrogène sont le plus nécessaires et réduire les trajets à vide inutiles. Bien que l’étude actuelle ait utilisé un jeu de données modeste provenant d’une seule caméra dans des conditions idéales, les auteurs soutiennent que la même stratégie peut être étendue à d’autres plaques tournantes du fret et à des environnements plus variés. Si elle est déployée à plus grande échelle et de manière responsable, une approche comme ZeroDray pourrait rendre visibles les détails invisibles des activités de fret, aidant les communautés et les décideurs à orienter les corridors de fret vers une exploitation plus propre et plus efficiente.

Citation: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4

Mots-clés: camions zéro‑émission, modèles vision‑langage, drayage portuaire, émissions du fret, transport durable