Clear Sky Science · zh
基于XGBoost与SHAP的上市公司ESG漂绿可解释预测模型
为何公司“绿色”主张重要
当一家公司宣称其在环境或社会层面取得了成就时,投资者和公众需要问:这是切实的进步,还是精心包装的营销?这种形象与现实之间的差距被称为漂绿。随着更多资金流入声称具备环境和社会责任的投资,能够及早识别漂绿对于保护投资者、指导政策以及奖励真正负责任的公司变得至关重要。
查看绿色承诺背后的真实情况
本研究聚焦于在中国上市的公司,考察其2009年至2022年的环境、社会与治理(ESG)行为。研究者没有简单接受公司的可持续发展报告,而是比较了两类独立的ESG评分。一类来自彭博(Bloomberg),反映公司在公开报告中披露的ESG信息量;另一类来自中外评级机构,反映公司在实践中实际的ESG表现。通过对这些评分进行标准化并相互相减,研究者构建了一个漂绿指数:那些说得多而做得少的公司会被标记为可能的漂绿者。
教模型识别漂绿模式
为了超越简单的平均值和经验规则,作者采用了一种现代机器学习方法——XGBoost,这种方法擅长在复杂、嘈杂的数据中发现模式。他们为每家公司输入了16个不同的特征,包括财务健康状况(如盈利、债务水平、增长与规模)、治理结构(如股权集中度和董事会人数)以及外部压力(如当地监管的严格程度、媒体监督强度和市场竞争程度)。目标是检验模型能否准确预测公司在一至两年后是否会漂绿。 
我们能多好地预测谁在漂绿?
表现最好的模型依赖于上一年度的公司特征。它能正确识别约87%的漂绿公司,并且远胜于随机猜测地将漂绿者与非漂绿者区分开来。财务指标被证明尤为具信息量。负债极高或极低、短期流动性过于宽松或市值异常偏高的公司更有可能被标记为漂绿者。相比之下,规模更大且增长更快的公司被预测为漂绿的可能性较低——这可能是因为它们的可见度和长期前景使得误导性信号更具风险。治理指标也很重要:当最大股东持股比例更高时,漂绿的可能性下降,但由监督层内部人持股比例较高则与更多的漂绿相关联。
打开人工智能的黑箱
人们常担心机器学习虽然准确但不透明。为了解决这一问题,研究使用了一种名为SHAP的技术,允许研究者将每个预测分解为各个特征的贡献。换言之,这意味着他们不仅可以指出某公司可能在漂绿,还能说明例如其异常高的流动比率和较低的股权集中度是关键原因。分析确认了财务指标的重要性,尤其是流动比率、代理成本以及持股分布,相比之下治理人员数量或董事会规模的权重较小。当用替代评级提供者衡量ESG表现,甚至将模型应用于香港上市公司时,模型仍然表现良好,这表明该方法在不同评级体系和披露环境下具有稳健性。 
这对投资者和监管者意味着什么
通俗地说,研究表明可以利用金融数据库中已广泛可得的信息构建一个可靠的ESG漂绿预警系统。通过将多种ESG评分与丰富的公司数据及可解释的机器学习模型相结合,监管者可以更高效地瞄准监管对象,投资者可以更好地避开华而不实的ESG故事,公司则会面临更大的压力以真实行动支持其主张。虽然研究以中国为主体,但基本思路——对比公司所说与所做,并让透明的算法学习这些模式——为清理全球市场上的ESG主张提供了可借鉴的蓝图。
引用: Jianfeng, Z., Tiantian, Q. Interpretable predictive model for listed companies ESG greenwashing based on XGBoost and SHAP. Sci Rep 16, 12899 (2026). https://doi.org/10.1038/s41598-026-42004-1
关键词: ESG漂绿, 可持续投资, 机器学习, 公司治理, 财务披露