Clear Sky Science · pt

Modelo visão-linguagem informado por domínio para frete sustentável com classificação de trem de força e carga de caminhões de drayage

· Voltar ao índice

Portos mais limpos, caminhões mais inteligentes

Os portos movimentam as mercadorias que abastecem nossas lojas, mas os caminhões de curta distância que circulam contêineres dentro e fora dos terminais também são grandes poluidores. Este estudo mostra como um novo tipo de inteligência artificial pode observar esses caminhões de "drayage" com câmeras à beira da estrada e dizer automaticamente quais ainda usam diesel e quais adotam tecnologias mais limpas—sem qualquer rotulagem manual das imagens. Esse tipo de percepção automatizada pode ajudar reguladores, planejadores e comunidades locais a acompanhar o progresso rumo a ar mais limpo em torno de alguns dos portos mais movimentados do mundo.

Por que os caminhões portuários importam para o clima e a saúde

Nos Estados Unidos, o transporte é a maior fonte isolada de gases de efeito estufa, e os caminhões pesados têm impacto desproporcional: representam uma pequena parcela dos veículos, mas uma grande parcela das emissões. Nada exemplifica isso melhor do que os Portos de Los Angeles e Long Beach, um par de portos vizinhos que, juntos, movimentam cerca de 40% das importações em contêiner dos EUA e também são a maior fonte fixa de poluição do ar do sul da Califórnia. Os caminhões de drayage—os veículos que transportam contêineres entre portos, pátios ferroviários e armazéns—geram grande parte dessa poluição apesar de percorrerem rotas relativamente curtas e previsíveis. Por isso, a Califórnia determinou que, até 2035, todos os caminhões de drayage portuário devem ser zero‑emissão, baseando‑se em tecnologias elétricas a bateria, célula de combustível de hidrogênio ou combustíveis mais limpos em vez do diesel convencional.

Figure 1
Figure 1.

Ver o que move um caminhão e o que ele carrega

Para saber se essas políticas estão funcionando, as autoridades precisam medir que tipos de caminhões realmente aparecem nos portões e nas rodovias: são diesel ou elétricos? Estão transportando um contêiner cheio, um chassi vazio ou nenhum reboque? Tradicionalmente, responder a essas perguntas exige construir grandes coleções de imagens rotuladas manualmente e treinar modelos específicos para a tarefa. Os autores propõem uma rota diferente, chamada ZeroDray, que usa um modelo visão‑linguagem—um sistema de IA capaz de entender imagens e texto—sem nenhum treinamento adicional. O modelo recebe imagens de câmeras à beira da estrada de caminhões que passam por um corredor que atende aos portos de Los Angeles e Long Beach e deve classificar tanto o trem de força (diesel, elétrico, gás natural comprimido ou hidrogênio) quanto a configuração da carga (contêiner único de 20 pés, equivalente de 40 pés mais longo, chassi vazio ou caminhão bobtail sem reboque).

Ensinar a IA a pensar como um especialista em caminhões

Prontos para uso, os modelos visão‑linguagem são generalistas: sabem um pouco de tudo da internet, mas carecem de conhecimento profundo sobre tópicos de nicho como drayage. O ZeroDray preenche essa lacuna alimentando o modelo com prompts cuidadosamente elaborados que codificam pistas de especialistas. Para trens de força, os prompts descrevem indícios visuais, como colunas de escape e grandes tanques de combustível para diesel, cilindros para GNC, tanques de hidrogênio para caminhões com célula de combustível, ou a ausência de hardware de escapamento e emblemas de EV para veículos elétricos. Para a carga, os prompts orientam o modelo a raciocinar sobre a geometria da cena: o comprimento do contêiner excede visivelmente sua altura e o comprimento da cabine, como em uma carga longa de 40 pés, ou está mais próximo em tamanho, como em um contêiner mais curto de 20 pés? Ao pedir que a IA trabalhe essas pistas passo a passo e explique seu raciocínio em linguagem clara, a metodologia torna as decisões mais transparentes e mais fáceis de verificar.

Figure 2
Figure 2.

Testando o sistema no tráfego real do porto

Os pesquisadores avaliaram o ZeroDray em 443 imagens de caminhões capturadas ao longo de dois dias em fevereiro de 2025 por uma câmera fixa à beira da estrada próxima aos portos. Observadores humanos forneceram rótulos de verdade de referência para o trem de força e a configuração de carga de cada caminhão. Em seguida, compararam o ZeroDray com uma configuração mais simples que fornecia apenas nomes de classes básicos ao mesmo modelo subjacente. Com orientação mínima, o sistema básico já reconhecia alguns casos diretos, como caminhões a diesel sem reboque. Mas ele teve sérias dificuldades quando as distinções dependiam de pequenas diferenças visuais ou da disposição espacial, frequentemente confundindo tratores diesel e elétricos ou trocando contêineres curtos por longos. Quando as pistas visuais informadas por especialistas e as regras espaciais foram adicionadas, a acurácia subiu dramaticamente. A classificação do trem de força atingiu cerca de 100% entre diesel, elétrico, hidrogênio e GNC. O reconhecimento de carga, especialmente a difícil distinção entre comprimentos equivalentes simples e duplos de contêiner, melhorou de cerca de metade corretos para aproximadamente 98%. No geral, considerando todas as 11 categorias combinadas de trem de força e carga, a estrutura ZeroDray aprimorada alcançou uma pontuação F1 média de 99%, superando em muito a abordagem básica.

O que isso significa para corredores de frete mais limpos

Para não especialistas, a conclusão principal é que uma IA de propósito geral, quando guiada com as pistas certas de especialistas, pode “olhar” confiavelmente vídeos de rodovias e dizer não apenas como os caminhões estão carregados, mas também o que os movimenta—sem nenhum treinamento customizado caro. Essa capacidade poderia oferecer às autoridades portuárias e aos reguladores uma nova ferramenta poderosa para monitorar a transição do diesel para caminhões de drayage zero‑emissão, identificar onde novas estações de carregamento ou de hidrogênio são mais necessárias e reduzir viagens vazias desperdiçadas. Embora o estudo atual tenha usado um conjunto de dados modesto de uma única câmera em condições ideais, os autores argumentam que a mesma estratégia pode ser expandida para outros centros de frete e ambientes mais variados. Se ampliados de forma responsável, sistemas como o ZeroDray poderiam tornar visíveis os detalhes invisíveis da atividade de frete, ajudando comunidades e formuladores de políticas a orientar os corredores de frete para operações mais limpas e eficientes.

Citação: Feng, G., Li, Y., Tok, A.Y.C. et al. Domain informed vision language model for sustainable freight with drayage truck powertrain and cargo classification. npj. Sustain. Mobil. Transp. 3, 15 (2026). https://doi.org/10.1038/s44333-026-00086-4

Palavras-chave: caminhões zero‑emissão, modelos visão‑linguagem, drayage portuário, emissões de frete, transporte sustentável