Clear Sky Science · zh

基于BERT的消费者对太阳能采用犹豫情绪分析

· 返回目录

人们为何仍对太阳能犹豫不决

光伏板承诺提供清洁、自产的电力,但许多家庭仍对将其安装在屋顶上心存疑虑。本研究深入挖掘了人们在社交媒体、评论和公开论坛上关于太阳能的真实表达,并使用现代语言AI系统来解读公众情绪。通过将数千条评论转化为对担忧与期望的清晰图景,研究显示了成本、信任和困惑如何阻碍太阳能推广,以及更智能的分析如何帮助政策制定者和企业做出回应。

Figure 1
Figure 1.

大规模倾听网络声音

研究人员没有依赖缓慢的问卷或小型焦点小组,而是收集了约5万条提及太阳能采用的公开帖子与评论,随后筛选出2.2万条明显的正面或负面条目。这些内容来自短消息、串行讨论、消费者评价网站与开放网页等平台。通过采集多种来源而非单一站点,研究降低了对某类用户或地区过度倾听的风险。经过细致的预处理——去重、剥离用户名与链接、统一措辞,并将“太阳能”或“太阳能成本”等关键短语归组——将这股噪声流转为更清洁、更具可比性的数据集,同时保护了用户隐私。

AI如何学习关于太阳能话语的语调

为了解读文本情绪,研究团队构建了一个混合模型,结合了两种互补的语言表征方式。一种称为TF–IDF,用以衡量某个词或短语在语料中的独特性,提升像“成本”“可靠性”“政策”或“回报期”等强烈指示重要主题的词语权重。另一种来自BERT,这是一种基于Transformer的现代语言模型,能将每句句子表示为高维空间中的向量,捕捉简单词频统计无法识别的细微差别、讽刺与语境。通过将这两种视角拼接成单一特征向量并在带标签的样本上训练分类器,系统既学会了哪些词重要,也理解了这些词在真实太阳能语句中的使用方式。

检验准确性并使结果可操作

混合方法不仅纸面上看起来巧妙,在实践中也表现稳健。在模型训练时从未见过的保留测试数据上,该模型达到0.82的F1分数,对正负情绪具有平衡的精确率与召回率,整体准确率为0.84。额外的检验——如受试者工作特征曲线(ROC)、精确率–召回率曲线以及校准图——显示预测概率与真实结果匹配良好,表明模型能识别何时自信、何时不确定。作者还进一步使用累计增益图、提升曲线和“Top-K”准确率来展示:如果政策制定者只能检查一小部分帖子,关注模型置信度最高的预测会比随机抽样发现更多与决策相关的、有价值的评论。

Figure 2
Figure 2.

人们最担心的是什么

一旦系统可靠地区分出正负讨论,研究人员便在负面阵营中梳理主导主题。他们发现超过40%的负面情绪集中在金钱问题——前期安装费用、对回本时间的怀疑以及对隐性费用的担忧。大约四分之一的负面评论强调对可靠性的担忧:电板在恶劣天气下能否工作、维护是否麻烦、能否信任安装商和设备?近五分之一的负面帖子反映出环境方面的质疑,例如对面板制造、回收的担忧,或在考虑全生命周期后太阳能是否确实能减少排放。政策方面的困惑与沮丧也有体现,但比这些核心障碍的强度略弱。

将洞见转化为更好的太阳能采用策略

对非专业读者来说,主要结论很直接:通过用针对太阳能领域调优的AI细致倾听大规模在线对话,可以量化阻碍人们接受太阳能的因素。成本是最大的障碍,其次是对性能的信任以及对环境效益的持续疑虑。由于模型可以突出置信度最高、信息量最大的案例并可视化随时间变化的趋势,它为政策制定者、安装商和倡导者提供了一个实用的公众关切仪表盘。反过来,这能指导有针对性的激励措施、更清晰的节省与可靠性沟通,以及对环境问题的更好回应——这些措施都有助于让更多家庭准备好迈向太阳能发电。

引用: Jabbar, A., Yuan, J., Al-Shamasneh, A.R. et al. BERT based sentiment analysis of consumer hesitancy toward solar energy adoption. Sci Rep 16, 8397 (2026). https://doi.org/10.1038/s41598-026-38604-6

关键词: 太阳能采用, 消费者情绪, 可再生能源犹豫, AI文本分析, BERT模型