Clear Sky Science · es
Modelo predictivo interpretable para el greenwashing ESG de empresas cotizadas basado en XGBoost y SHAP
Por qué importan las afirmaciones “verdes” de las empresas
Cuando una empresa presume de sus logros ambientales o sociales, los inversores y el público deben preguntarse: ¿se trata de un progreso real o sólo de marketing inteligente? Esta brecha entre la imagen y la realidad se denomina greenwashing. A medida que más dinero fluye hacia inversiones que prometen ser ambiental y socialmente responsables, ser capaz de detectar el greenwashing de forma temprana se vuelve crucial para proteger a los inversores, orientar la política y premiar a las empresas que actúan de forma genuinamente responsable.
Mirando bajo el capó de las promesas verdes
El estudio se centra en empresas cotizadas en China y examina su comportamiento en materia de Medio Ambiente, Social y Gobernanza (ESG) entre 2009 y 2022. En lugar de aceptar los informes de sostenibilidad de las empresas al pie de la letra, los autores comparan dos tipos independientes de calificaciones ESG. Una, de Bloomberg, capta cuánto informa una empresa sobre ESG en sus informes públicos. La otra, de agencias calificadoras chinas e internacionales, refleja hasta qué punto la empresa realmente desempeña en la práctica en asuntos ESG. Al estandarizar y restar estas puntuaciones, los investigadores construyen un índice de greenwashing: las empresas que hablan mucho más de lo que actúan se señalan como probables greenwashers.
Enseñar a un modelo a reconocer patrones de greenwashing
Para ir más allá de simples promedios y reglas empíricas, los autores emplean un método moderno de aprendizaje automático llamado XGBoost, especialmente eficiente para detectar patrones en datos complejos y ruidosos. Alimentan el modelo con 16 características diferentes por empresa. Estas incluyen la salud financiera (como beneficios, niveles de deuda, crecimiento y tamaño), la estructura de gobierno (por ejemplo, cuán concentrada está la propiedad y cuántos directores hay en el consejo) y las presiones externas (por ejemplo, la rigidez de la regulación local, la intensidad del escrutinio mediático y la competitividad del mercado). El objetivo es ver si el modelo puede predecir con precisión qué empresas incurrirán en greenwashing uno o dos años después. 
¿Qué tan bien podemos predecir quién practica greenwashing?
El modelo que mejor se desempeña se basa en las características de la empresa del año anterior. Identifica correctamente alrededor del 87% de las empresas que hacen greenwashing y las distingue de las que no lo hacen mucho mejor que el azar. Los indicadores financieros resultan especialmente informativos. Las empresas con cargas de deuda extremadamente altas o bajas, liquidez a corto plazo muy holgada o valoraciones de mercado anormalmente elevadas tienen más probabilidades de ser señaladas como greenwashers. Por el contrario, las empresas más grandes y de mayor crecimiento son menos propensas a ser predichas como greenwashers—posiblemente porque su visibilidad y perspectiva a largo plazo hacen que la señalización engañosa sea más arriesgada. Los indicadores de gobernanza también importan: cuando el mayor accionista posee una porción mayor de la empresa, el greenwashing es menos probable, pero una mayor participación de insiders supervisores se asocia con más greenwashing.
Abrir la caja negra de la inteligencia artificial
Una preocupación común sobre el aprendizaje automático es que puede ser preciso pero opaco. Para abordar esto, el estudio utiliza una técnica llamada SHAP, que permite a los investigadores descomponer cada predicción en contribuciones de características individuales. En términos prácticos, esto significa que pueden decir no sólo que una determinada empresa probablemente hace greenwashing, sino también que, por ejemplo, su ratio de liquidez corriente inusualmente alto y su baja concentración de propiedad fueron razones clave. El análisis confirma que los indicadores financieros, en especial el ratio corriente, los costes de agencia y la distribución de la propiedad, pesan más que el número de cargos de gobernanza o el tamaño del consejo. El modelo sigue funcionando bien cuando el desempeño ESG se mide mediante proveedores de calificación alternativos e incluso cuando se aplica a empresas cotizadas en Hong Kong, lo que sugiere que el enfoque es robusto frente a distintos sistemas de calificación y entornos de divulgación. 
Qué significa esto para inversores y vigilantes
En términos cotidianos, el estudio muestra que es posible construir un sistema de alerta temprana fiable para el greenwashing ESG usando información que ya está ampliamente disponible en bases de datos financieras. Al combinar múltiples calificaciones ESG con datos empresariales ricos y un modelo de aprendizaje automático interpretable, los reguladores podrían dirigir su supervisión con mayor eficiencia, los inversores podrían evitar mejor las historias ESG brillantes pero huecas, y las empresas enfrentarían una mayor presión para respaldar sus afirmaciones con acciones reales. Aunque el trabajo se centra en China, la receta básica—comparar lo que las empresas dicen con lo que hacen y permitir que algoritmos transparentes aprendan los patrones—ofrece una hoja de ruta para limpiar las afirmaciones ESG en mercados de todo el mundo.
Cita: Jianfeng, Z., Tiantian, Q. Interpretable predictive model for listed companies ESG greenwashing based on XGBoost and SHAP. Sci Rep 16, 12899 (2026). https://doi.org/10.1038/s41598-026-42004-1
Palabras clave: greenwashing ESG, inversión sostenible, aprendizaje automático, gobierno corporativo, divulgación financiera