Clear Sky Science · pl

Model wizji i języka uwzględniający domenę dla zrównoważonego transportu towarów z klasyfikacją napędu drayage i ładunku

· Powrót do spisu

Czystsze porty, inteligentniejsze ciężarówki

Porty przetwarzają towary zaopatrujące nasze sklepy, ale krótkodystansowe ciężarówki kursujące między terminalami są też znaczącymi źródłami zanieczyszczeń. W tym badaniu pokazano, jak nowy rodzaj sztucznej inteligencji może obserwować te „drayage” ciężarówki za pomocą kamer przydrożnych i automatycznie rozpoznawać, które nadal spalają olej napędowy, a które używają czystszych technologii — bez ręcznego etykietowania zdjęć. Taka zautomatyzowana analiza może pomóc regulatorom, planistom i społecznościom lokalnym śledzić postępy w osiąganiu czystszego powietrza wokół jednych z najbardziej ruchliwych portów na świecie.

Dlaczego ciężarówki portowe mają znaczenie dla klimatu i zdrowia

W Stanach Zjednoczonych transport jest największym pojedynczym źródłem emisji gazów cieplarnianych, a ciężkie ciężarówki mają dysproporcjonalnie duży udział: stanowią niewielką część floty, ale generują znaczną część emisji. Najbardziej widoczne jest to wokół portów Los Angeles i Long Beach, sąsiadujących ze sobą portów, które łącznie obsługują około 40 procent amerykańskiego importu kontenerowego i są największym stacjonarnym źródłem zanieczyszczeń powietrza w południowej Kalifornii. Ciężarówki drayage — zestawy przewożące kontenery między portami, bocznicami kolejowymi i magazynami — generują dużą część tego zanieczyszczenia, mimo że pokonują stosunkowo krótkie, przewidywalne trasy. W związku z tym Kalifornia nakazała, by do 2035 roku wszystkie ciężarówki portowe były zero‑emisyjne, bazując na napędach bateryjnych, ogniwach paliwowych wodorowych lub czystszych gazach zamiast konwencjonalnego diesla.

Figure 1
Figure 1.

Rozpoznawanie, co napędza ciężarówkę i co przewozi

Aby ocenić skuteczność tych polityk, urzędnicy muszą mierzyć, jakie rodzaje ciężarówek faktycznie pojawiają się przy bramach portowych i na drogach: czy to diesel czy elektryk? czy ciągną pełny kontener, pusty podwozie, czy nie mają przyczepy w ogóle? Tradycyjnie odpowiedź na takie pytania wymaga budowy dużych, ręcznie oznakowanych zbiorów obrazów i trenowania modeli do konkretnych zadań. Autorzy proponują inną drogę, nazwaną ZeroDray, która wykorzystuje model wizja‑język — system AI rozumiejący zarówno obrazy, jak i tekst — bez dodatkowego trenowania. Model otrzymuje obrazy z kamer przydrożnych przechwytujących przejeżdżające ciężarówki w korytarzu obsługującym porty Los Angeles i Long Beach i musi sklasyfikować zarówno układ napędu (diesel, elektryczny, sprężony gaz ziemny CNG lub wodór), jak i konfigurację ładunku (pojedynczy kontener 20 stóp, równoważnik 40 stóp, puste podwozie lub ciężarówka typu bobtail bez przyczepy).

Nauczanie AI myślenia jak ekspert od drayage

Modele wizja‑język są z natury generalistami: wiedzą trochę o wszystkim z internetu, ale brak im głębokiej wiedzy w niszowych tematach, takich jak drayage. ZeroDray wypełnia tę lukę, dostarczając modelowi starannie przygotowane podpowiedzi kodujące wskazówki eksperckie. Dla napędów podpowiedzi opisują wizualne wskazówki, takie jak słupy wydechowe i duże zbiorniki paliwa dla diesla, cylindryczne zbiorniki dla CNG, zbiorniki na wodór dla ciężarówek z ogniwami paliwowymi, lub brak elementów wydechowych i oznaczeń EV w przypadku ciężarówek elektrycznych. Dla ładunku podpowiedzi nakazują modelowi rozumować o geometrii sceny: czy długość kontenera wyraźnie przewyższa jego wysokość i długość kabiny, jak w długim ładunku 40‑stopowym, czy jest bliższa rozmiarowi krótszego kontenera 20‑stopowego? Poproszenie AI, by przeanalizowało te wskazówki krok po kroku i wyjaśniało swoje rozumowanie prostym językiem, sprawia, że decyzje są bardziej przejrzyste i łatwiejsze do weryfikacji.

Figure 2
Figure 2.

Testowanie systemu na rzeczywistym ruchu portowym

Badacze ocenili ZeroDray na 443 zdjęciach ciężarówek zarejestrowanych w ciągu dwóch dni w lutym 2025 roku przez stałą kamerę przydrożną w pobliżu portów. Ludzie‑obserwatorzy dostarczyli etykiety jako prawdę ziemi dla napędu i konfiguracji ładunku każdej ciężarówki. Następnie porównali ZeroDray z prostszym ustawieniem, które dostarczało temu samemu modelowi jedynie nazwy klas. Przy minimalnym przewodnictwie podstawowy system już rozpoznawał niektóre oczywiste przypadki, takie jak ciężarówki z dieslem bez przyczepy. Miał jednak poważne trudności, gdy rozróżnienia opierały się na małych różnicach wizualnych lub układzie przestrzennym, często myląc ciągniki diesla i elektryczne lub myląc krótkie i długie kontenery. Po dodaniu wskazówek eksperckich dotyczących cech wizualnych i zasad przestrzennych dokładność znacznie wzrosła. Klasyfikacja napędu osiągnęła około 100 procent dla diesla, elektrycznych, wodorowych i CNG. Rozpoznawanie ładunku, zwłaszcza trudne rozróżnienie między pojedynczą i podwójną długością równoważną, poprawiło się z około połowy poprawnych do około 98 procent. W sumie, we wszystkich 11 połączonych kategoriach napęd‑ładunek, rozszerzone ramy ZeroDray osiągnęły średni wynik F1 na poziomie 99 procent, znacząco przewyższając podejście podstawowe.

Co to oznacza dla czystszych korytarzy transportu towarowego

Dla niespecjalistów kluczowy wniosek jest taki, że ogólnego przeznaczenia AI, gdy jest poprowadzone odpowiednimi wskazówkami eksperckimi, może wiarygodnie „patrzeć” na wideo z autostrady i określać nie tylko, jak ładunki są załadowane, ale także, co je napędza — bez kosztownego, specjalistycznego treningu. Ta zdolność mogłaby dostarczyć władzom portów i regulatorom potężne narzędzie do monitorowania przejścia z diesla na zero‑emisyjne ciężarówki drayage, wskazywania miejsc, gdzie najbardziej potrzebne są nowe stacje ładowania lub wodorowe, oraz ograniczania nieefektywnych pustych przejazdów. Choć obecne badanie korzystało z umiarkowanego zbioru danych z jednej kamery w warunkach sprzyjających, autorzy twierdzą, że tę samą strategię można rozszerzyć na inne węzły towarowe i bardziej zróżnicowane środowiska. Przy odpowiedzialnym skalowaniu systemy takie jak ZeroDray mogłyby uwidocznić niewidoczne szczegóły aktywności transportowej, pomagając społecznościom i decydentom przesunąć korytarze transportowe w stronę czystszej i bardziej efektywnej działalności.

Cytowanie: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4

Słowa kluczowe: ciężarówki zero‑emisyjne, modele wizja‑język, transport portowy (drayage), emisje towarowe, zrównoważony transport