Clear Sky Science · it
Modello predittivo interpretabile per il greenwashing ESG delle società quotate basato su XGBoost e SHAP
Perché contano le affermazioni “verdi” delle aziende
Quando un’azienda si vanta dei propri risultati ambientali o sociali, investitori e pubblico devono chiedersi: si tratta di progressi reali o solo di abilità di marketing? Questo scarto tra immagine e realtà è chiamato greenwashing. Con l’aumento dei capitali diretti verso investimenti che promettono sostenibilità ambientale e sociale, saper individuare il greenwashing in anticipo diventa cruciale per proteggere gli investitori, orientare le politiche e premiare le imprese che sono davvero responsabili.
Guardare sotto la superficie delle promesse verdi
Lo studio si concentra su società quotate in Cina e analizza il loro comportamento ESG (Ambientale, Sociale e di Governance) dal 2009 al 2022. Invece di prendere per buoni i report di sostenibilità delle imprese, gli autori confrontano due tipi indipendenti di valutazioni ESG. Una, di Bloomberg, misura quanto una società divulga informazioni ESG nei report pubblici. L’altra, fornita da agenzie di rating cinesi e internazionali, riflette la performance effettiva dell’azienda sulle questioni ESG nella pratica. Standardizzando e sottraendo questi punteggi, i ricercatori costruiscono un indice di greenwashing: le imprese che parlano molto più di quanto agiscono vengono segnate come potenziali greenwasher.
Insegnare a un modello a riconoscere i modelli di greenwashing
Per andare oltre medie semplici e regole empiriche, gli autori adottano un moderno metodo di machine learning chiamato XGBoost, particolarmente efficace nel trovare pattern in dati complessi e rumorosi. Alimentano il modello con 16 caratteristiche diverse per ogni azienda. Queste includono la salute finanziaria (come profitti, livelli di debito, crescita e dimensione), la struttura di governance (come la concentrazione della proprietà e il numero di amministratori) e le pressioni esterne (come la severità della regolamentazione locale, l’intensità del controllo mediatico e la competitività del mercato). L’obiettivo è verificare se il modello può prevedere con precisione quali aziende praticheranno greenwashing uno o due anni dopo. 
Quanto bene possiamo prevedere chi fa greenwashing?
Il modello più performante si basa sulle caratteristiche aziendali dell’anno precedente. Identifica correttamente circa l’87% delle aziende che fanno greenwashing e le distingue dai non-greenwasher molto meglio del caso. Gli indicatori finanziari risultano particolarmente informativi. Le imprese con oneri di debito estremamente elevati o molto bassi, liquidità a breve termine troppo agevole o valutazioni di mercato insolitamente alte sono più propense a essere segnalate come greenwasher. Le aziende più grandi e a crescita più rapida, al contrario, hanno una probabilità minore di essere previste come greenwasher — forse perché la loro visibilità e l’orizzonte di lungo periodo rendono più rischioso il segnalare in modo ingannevole. Anche gli indicatori di governance contano: quando il maggiore azionista possiede una fetta più ampia della società, il greenwashing diventa meno probabile, mentre partecipazioni elevate di insider di supervisione risultano associate a più greenwashing.
Aprire la scatola nera dell’intelligenza artificiale
Una preoccupazione comune sul machine learning è che possa essere accurato ma opaco. Per affrontare questo punto, lo studio utilizza una tecnica chiamata SHAP, che permette ai ricercatori di decomporre ogni previsione nei contributi delle singole caratteristiche. In termini pratici, ciò significa che possono spiegare non solo che una data azienda è probabile che faccia greenwashing, ma anche che, per esempio, il suo rapporto corrente insolitamente alto e la bassa concentrazione della proprietà sono state ragioni chiave. L’analisi conferma che gli indicatori finanziari, in particolare il rapporto corrente, i costi di agenzia e la distribuzione della proprietà, pesano più della semplice conta degli organi di governance o della dimensione del consiglio. Il modello funziona bene anche quando la performance ESG è misurata da fornitori di rating alternativi e persino quando viene applicato a società quotate a Hong Kong, suggerendo che l’approccio è robusto attraverso diversi sistemi di rating e contesti di divulgazione. 
Cosa significa per investitori e autorità di controllo
In termini pratici, lo studio mostra che è possibile costruire un sistema di allerta precoce affidabile per il greenwashing ESG usando informazioni già ampiamente disponibili nelle banche dati finanziarie. Combinando più rating ESG con dati aziendali ricchi e un modello di machine learning interpretabile, i regolatori potrebbero indirizzare la loro vigilanza in modo più efficiente, gli investitori potrebbero evitare meglio storie ESG luccicanti ma vuote, e le aziende sarebbero sottoposte a una pressione più forte per supportare le proprie affermazioni con azioni reali. Pur concentrandosi sulla Cina, la ricetta di base — confrontare ciò che le aziende dicono con ciò che fanno e lasciare che algoritmi trasparenti apprendano i modelli — offre un modello per ripulire le affermazioni ESG nei mercati di tutto il mondo.
Citazione: Jianfeng, Z., Tiantian, Q. Interpretable predictive model for listed companies ESG greenwashing based on XGBoost and SHAP. Sci Rep 16, 12899 (2026). https://doi.org/10.1038/s41598-026-42004-1
Parole chiave: Greenwashing ESG, investimenti sostenibili, apprendimento automatico, governance aziendale, informativa finanziaria