Clear Sky Science · pt
Modelo preditivo interpretável para greenwashing ESG de empresas listadas baseado em XGBoost e SHAP
Por que as alegações "verdes" das empresas importam
Quando uma empresa exalta suas conquistas ambientais ou sociais, investidores e o público precisam perguntar: isso é progresso real ou apenas marketing bem elaborado? Essa diferença entre imagem e realidade é chamada de greenwashing. À medida que mais recursos fluem para investimentos que prometem responsabilidade ambiental e social, ser capaz de detectar greenwashing cedo torna-se crucial para proteger investidores, orientar políticas e recompensar empresas genuinamente responsáveis.
Olhando por trás das promessas verdes
O estudo foca em empresas listadas na China e analisa seu comportamento em termos de Ambiental, Social e Governança (ESG) de 2009 a 2022. Em vez de aceitar relatórios de sustentabilidade das empresas ao pé da letra, os autores comparam dois tipos independentes de classificações ESG. Uma, da Bloomberg, capta quanto de informação ESG a empresa divulga em relatórios públicos. A outra, de agências de classificação chinesas e internacionais, reflete o quão bem a empresa realmente se sai em questões ESG na prática. Ao padronizar e subtrair essas pontuações, os pesquisadores constroem um índice de greenwashing: empresas que falam muito mais do que agem são sinalizadas como prováveis greenwashers.
Ensinando um modelo a reconhecer padrões de greenwashing
Para ir além de médias simples e regras empíricas, os autores usam um método moderno de aprendizado de máquina chamado XGBoost, particularmente eficiente em encontrar padrões em dados complexos e ruidosos. Eles alimentam o modelo com 16 características diferentes para cada empresa. Entre elas estão a saúde financeira (como lucros, níveis de endividamento, crescimento e porte), a estrutura de governança (como concentração de propriedade e número de diretores no conselho) e pressões externas (como rigor da regulação local, intensidade da cobertura da mídia e competitividade do mercado da empresa). O objetivo é verificar se o modelo pode prever com precisão quais empresas estarão praticando greenwashing um ou dois anos depois. 
Quão bem conseguimos prever quem está fazendo greenwashing?
O modelo de melhor desempenho baseia-se em características da empresa do ano anterior. Ele identifica corretamente cerca de 87% das empresas que praticam greenwashing e as distingue de não-greenwashers muito melhor do que um palpite aleatório. Indicadores financeiros mostram-se especialmente informativos. Empresas com níveis de endividamento extremamente altos ou baixos, liquidez de curto prazo muito fácil ou valorizações de mercado incomumente elevadas têm maior probabilidade de serem marcadas como greenwashers. Empresas maiores e em crescimento mais rápido, por outro lado, são menos propensas a serem previstas como greenwashers — possivelmente porque sua visibilidade e perspectiva de longo prazo tornam a sinalização enganosa mais arriscada. Indicadores de governança também importam: quando o maior acionista detém uma fatia maior da empresa, o greenwashing torna-se menos provável, mas participações maiores por insiders supervisores estão associadas a mais greenwashing.
Abrindo a caixa-preta da inteligência artificial
Uma preocupação comum sobre aprendizado de máquina é que ele pode ser preciso, mas opaco. Para resolver isso, o estudo usa uma técnica chamada SHAP, que permite aos pesquisadores decompor cada previsão em contribuições de características individuais. Na prática, isso significa que eles podem dizer não apenas que uma dada empresa provavelmente está fazendo greenwashing, mas também que, por exemplo, sua razão corrente incomumente alta e baixa concentração de propriedade foram razões-chave. A análise confirma que indicadores financeiros, especialmente a razão corrente, custos de agência e distribuição da propriedade, têm mais peso do que contagens de cargos de governança ou o tamanho do conselho. O modelo continua a ter bom desempenho quando o desempenho ESG é medido por provedores alternativos de classificação e mesmo quando aplicado a empresas listadas em Hong Kong, sugerindo que a abordagem é robusta em diferentes sistemas de classificação e ambientes de divulgação. 
O que isso significa para investidores e órgãos fiscalizadores
Em termos práticos, o estudo mostra que é possível construir um sistema de alerta precoce confiável para greenwashing ESG usando informações já amplamente disponíveis em bases de dados financeiras. Ao combinar múltiplas classificações ESG com dados ricos sobre empresas e um modelo interpretável de aprendizado de máquina, reguladores poderiam direcionar sua fiscalização com mais eficiência, investidores poderiam evitar melhor histórias ESG brilhantes, porém vazias, e empresas enfrentariam pressão maior para respaldar suas alegações com ações reais. Embora o trabalho se concentre na China, a receita básica — comparar o que as empresas dizem com o que fazem e deixar algoritmos transparentes aprenderem os padrões — oferece um roteiro para limpar as alegações ESG em mercados ao redor do mundo.
Citação: Jianfeng, Z., Tiantian, Q. Interpretable predictive model for listed companies ESG greenwashing based on XGBoost and SHAP. Sci Rep 16, 12899 (2026). https://doi.org/10.1038/s41598-026-42004-1
Palavras-chave: greenwashing ESG, investimento sustentável, aprendizado de máquina, governança corporativa, divulgação financeira