Clear Sky Science · ru

Модель зрения и языка, информированная предметной областью, для устойчивых грузоперевозок: классификация силовой установки и груза у дрейдж-траков

· Назад к списку

Чище порты, умнее грузовики

Порты перемещают товары, которые пополняют наши магазины, но короткомагистральные грузовики, перевозящие контейнеры в терминалы и обратно, также являются крупными источниками загрязнения. В этом исследовании показано, как новый тип искусственного интеллекта может наблюдать за такими «дрейдж»-грузовиками с помощью камер на обочине и автоматически определять, какие из них всё ещё работают на дизеле, а какие используют более чистые технологии — без ручной разметки изображений. Подобная автоматизированная информация может помочь регуляторам, планировщикам и местным сообществам отслеживать прогресс в улучшении качества воздуха вокруг одних из самых загруженных портов мира.

Почему портовые грузовики важны для климата и здоровья

В Соединённых Штатах транспорт — крупнейший единичный источник парниковых газов, и тяжёлые грузовики дают непропорционально большой вклад: их доля среди транспортных средств невелика, но доля в эмиссиях велика. Особенно это заметно вокруг портов Лос-Анджелеса и Лонг-Бич — пары соседних гаваней, которые вместе обрабатывают около 40 процентов американского импорта контейнеров и являются крупнейшим фиксированным источником загрязнения воздуха в Южной Калифорнии. Дрейдж-грузовики — тягачи, перевозящие контейнеры между портами, железнодорожными сортировками и складами — генерируют значительную часть этого загрязнения, несмотря на относительно короткие и предсказуемые маршруты. Поэтому Калифорния распорядились, что к 2035 году все портовые дрейдж-грузовики должны быть бесвыбросными, полагаясь на аккумуляторные электромобили, водородные топливные элементы или более чистые газовые технологии вместо традиционного дизеля.

Figure 1
Figure 1.

Определять, чем питается грузовик и что он везёт

Чтобы понять, работают ли эти политики, чиновникам нужно измерять, какие грузовики фактически оказываются у ворот портов и на трассах: дизельные ли они или электрические? Перевозят ли они полный контейнер, пустую раму или вообще без прицепа? Традиционно такие вопросы требуют создания больших вручную размеченных коллекций изображений и обучения моделей под конкретные задачи. Авторы предлагают другой путь — ZeroDray, использующий модель «зрение‑язык» — ИИ, который понимает и изображения, и текст — без дополнительного обучения. Модель получает кадры с обочины дороги с проезжающими грузовиками по коридору, обслуживающему порты Лос-Анджелеса и Лонг-Бич, и должна классифицировать как силовую установку (дизель, электричество, сжатый природный газ или водород), так и конфигурацию груза (одинарный 20‑футовый контейнер, эквивалент 40‑футового, пустая шасси или «бобтейл» — тягач без прицепа).

Учить ИИ думать как эксперт по грузовикам

Из коробки модели «зрение‑язык» — универсалы: они знают немного обо всём из интернета, но им не хватает глубины в нишевых темах, таких как дрейдж‑перевозки. ZeroDray заполняет этот разрыв, давая модели тщательно составленные подсказки, содержащие экспертные намёки. Для силовых установок подсказки описывают визуальные признаки: выхлопные стойки и большие топливные баки у дизеля, цилиндрические баллоны у СНГ, баки для водорода у топливных элементов или отсутствие выхлопного оборудования и эмблем электромобилей у электрических тягачей. Для груза подсказки просят модель рассуждать о геометрии сцены: превышает ли длина контейнера заметно его высоту и длину кабины, как у длинного 40‑футового груза, или близка по размерам, как у короткого 20‑футового контейнера? Прося ИИ пошагово пройти по этим признакам и объяснить своё рассуждение простым языком, рамочная методика делает решения более прозрачными и проверяемыми.

Figure 2
Figure 2.

Тестирование системы на реальном портовом трафике

Исследователи оценили ZeroDray на 443 изображениях грузовиков, заснятых за два дня в феврале 2025 года фиксированной камерой на обочине рядом с портами. Человеческие наблюдатели предоставили эталонные метки для каждой силовой установки и конфигурации груза. Затем они сравнили ZeroDray с более простым вариантом, который передавал той же базовой модели только голые названия классов. При минимальном руководстве базовая система уже правильно распознавала очевидные случаи, например дизельные грузовики без прицепа. Но она серьёзно ошибалась, когда различия зависели от мелких визуальных деталей или пространственной компоновки, часто путая дизельные и электрические тягачи или смешивая короткие и длинные контейнеры. После добавления экспертно информированных визуальных подсказок и правил по пространственному расположению точность резко выросла. Классификация силовой установки достигла примерно 100 процентов по дизелю, электричеству, водороду и СНГ. Распознавание груза, особенно трудное различение между одиночной и двойной (эквивалентной) длиной контейнера, улучшилось с примерно половины правильных ответов до примерно 98 процентов. В целом по всем 11 комбинированным категориям «силовая установка‑груз» усовершенствованная система ZeroDray достигла среднего F1‑балла в 99 процентов, значительно опередив базовый подход.

Что это значит для более чистых грузовых коридоров

Для неспециалистов главный вывод таков: универсальная модель ИИ, будучи направленной правильными экспертными подсказками, может надёжно «смотреть» видео с трасс и определять не только загрузку грузовиков, но и то, чем они питаются — без дорогостоящего специального обучения. Эта возможность может предоставить портовым администрациям и регуляторам мощный новый инструмент для мониторинга перехода от дизеля к бесвыбросным дрейдж‑грузовикам, для определения мест, где наиболее необходимы станции зарядки или заправки водородом, и для сокращения пустых и бесполезных рейсов. Хотя текущее исследование использовало скромный набор данных с одной камеры в благоприятных условиях, авторы утверждают, что ту же стратегию можно расширить на другие грузовые узлы и более разнообразные условия. При ответственном масштабировании системы вроде ZeroDray могли бы сделать невидимые детали грузовой активности видимыми, помогая сообществам и политикам продвигать грузовые коридоры к более чистой и эффективной работе.

Цитирование: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4

Ключевые слова: бесвыбросные грузовики, модели «зрение-язык», портовый дрейдж, эмиссии в грузоперевозках, устойчивый транспорт