Clear Sky Science · ru

Анализ тональности на основе BERT: колебания потребителей в отношении внедрения солнечной энергетики

2026-02-11 · Назад к списку

Почему люди до сих пор сомневаются в солнечной энергии

Солнечные панели обещают чистую энергию, произведённую локально, но многие домохозяйства всё ещё колеблются, стоит ли устанавливать их на крышах. Это исследование анализирует, что люди действительно говорят в интернете о солнечной энергии — в социальных сетях, отзывах и публичных форумах — и использует современную языковую систему ИИ для считывания настроений. Превращая тысячи комментариев в ясную картину тревог и ожиданий, работа показывает, где именно стоимость, доверие и неясность мешают распространению солнечной энергии, и как более умный анализ может помочь политикам и компаниям реагировать.

Слушая онлайн-голоса в большом масштабе

Вместо того чтобы полагаться на медленные опросы или небольшие фокус-группы, исследователи собрали около 50 000 публичных постов и отзывов, в которых упоминалось внедрение солнечной энергетики, — затем отфильтровали это до 22 000 явно положительных или отрицательных сообщений. Данные поступали с платформ вроде коротких сообщений, ветвящихся дискуссий, сайтов с отзывами потребителей и открытых веб-страниц. Опираясь на множество источников, а не на один сайт, исследование снижает риск чрезмерного учета мнений одного типа пользователей или региона. Тщательная предобработка — удаление дубликатов, очистка имен пользователей и ссылок, стандартизация формулировок и группировка ключевых фраз, таких как «солнечная энергия» или «стоимость солнца» — превратила этот шумный поток в более чистый, сопоставимый набор данных, одновременно защищая приватность пользователей.

Как ИИ учится тональности разговоров о солнце

Чтобы считать тональность в тексте, команда создала гибридную модель, которая сочетает два дополняющих друг друга способа представления языка. Один, называемый TF–IDF, измеряет, насколько характерно то или иное слово или фраза в корпусе, выделяя термины, которые сильно сигнализируют о важных темах — например «стоимость», «надежность», «политика» или «окупаемость». Другой источник — BERT, современная трансформерная языковая модель, которая представляет каждое предложение в высокоразмерном пространстве, улавливая нюансы, иронию и контекст, которых простые подсчёты слов не фиксируют. Объединив эти два представления в один вектор признаков и обучив классификатор на размеченных примерах, система узнаёт и какие слова важны, и как они используются в реальных предложениях о солнечной энергии.

Проверка точности и превращение результатов в практику

Гибридный подход оказался полезен не только на бумаге — он показывает надёжные результаты на практике. На отложенных тестовых данных, которые модель не видела при обучении, она достигает F1-метрики 0,82 с балансом точности и полноты для положительного и отрицательного классов и общей точностью 0,84. Дополнительные проверки — такие как кривые ROC, кривые точности–полноты и калибровочные графики — демонстрируют, что прогнозируемые вероятности хорошо соответствуют реальным результатам, то есть модель понимает, когда она уверена, а когда сомневается. Авторы также идут дальше, используя диаграммы накопленного выигрыша, lift-кривые и «Top-K» точность, чтобы показать: если политик может просмотреть лишь небольшую долю сообщений, фокусировка на наиболее уверенных предсказаниях модели выявляет значительно больше релевантных, стоящих для принятия решений комментариев, чем случайная выборка.

О чём люди беспокоятся больше всего

Когда система надежно разделяет позитивные и негативные обсуждения, исследователи заглядывают внутрь негативного сегмента, чтобы понять доминирующие темы. Они обнаружили, что более 40% негативных высказываний сосредоточены на деньгах — первоначальные затраты на установку, сомнения в сроках окупаемости и опасения скрытых платежей. Примерно четверть отрицательных комментариев подчёркивает беспокойства о надёжности: будут ли панели работать в плохую погоду, не станет ли обслуживание проблемой и можно ли доверять монтажникам и оборудованию. Почти каждый пятый негативный пост отражает экологический скептицизм, например опасения по поводу производства панелей, их утилизации или того, действительно ли солнце сокращает выбросы при учёте полного жизненного цикла. Также проявляются замешательство и раздражение по поводу политики, но в меньшей степени, чем эти ключевые барьеры.

Преобразование инсайтов в лучшее внедрение солнечной энергетики

Для неспециалиста основной вывод прост: внимательное прослушивание масштабных онлайн-разговоров с помощью ИИ, настроенного на тематику солнца, позволяет количественно оценить, что удерживает людей от перехода на солнечную энергию. Стоимость оказывается крупнейшим препятствием, за ней следуют доверие к работе системы и остающиеся сомнения в экологической пользе. Поскольку модель может выделять наиболее уверенные, информативные примеры и визуализировать тренды во времени, она предоставляет политикам, монтажным компаниям и защитникам интересов практическую панель общественных забот. Это, в свою очередь, может направить целевые стимулы, более прозрачное коммуницирование о сбережениях и надёжности, а также лучшие ответы на экологические вопросы — шаги, которые могут помочь большему числу домохозяйств решиться на переход к солнечной энергии.

Цитирование: Jabbar, A., Yuan, J., Al-Shamasneh, A.R. et al. BERT based sentiment analysis of consumer hesitancy toward solar energy adoption. Sci Rep 16, 8397 (2026). https://doi.org/10.1038/s41598-026-38604-6

Ключевые слова: внедрение солнечной энергетики, потребительские настроения, сомнения по поводу возобновляемой энергии, анализ текстов ИИ, модель BERT