Clear Sky Science · ru

Понимание дискурса о психическом здоровье на Reddit с помощью трансформеров и методов объяснимости

· Назад к списку

Почему важно, о чём люди пишут в сети

Многие люди, испытывающие тревогу, депрессию, биполярное расстройство или расстройство личности пограничного типа, прежде чем обратиться к специалисту, ищут помощи в интернете. Reddit с его анонимными сообществами стал крупным местом для того, чтобы делиться страхами, просить помощи и поддерживать других. В этом исследовании анализируется, как выглядят тысячи таких разговоров и как искусственный интеллект может их сортировать, а также выделять слова, которые люди чаще всего используют при обсуждении разных проблем с психическим здоровьем.

Заглянуть в сообщества поддержки

Исследователи сосредоточились на четырёх больших сообществах Reddit, посвящённых тревоге, депрессии, биполярному расстройству и пограничному расстройству личности (часто сокращают до BPD). Каждый пост в их наборе данных был помечен только тем сообществом, из которого он взят, а не медицинским диагнозом. Команда рассматривала эти сообщества как «пространства переживаний», где люди с похожими трудностями собираются, чтобы выговориться, попросить совета и поддержать друг друга. Изучая различия в языке между этими пространствами, авторы хотели понять, как люди описывают свой опыт своими словами, вне клиники.

Figure 1
Figure 1.

Обучение компьютеров сортировать разговоры

Чтобы проанализировать более 150 000 постов, авторы использовали мощные языковые модели — трансформеры, в частности BERT и его специализированную версию для психического здоровья под названием MentalBERT. Эти модели читали каждый пост и пытались угадать, какому из четырёх сообществ он принадлежит. Поскольку в некоторых сообществах было намного больше постов, команда тщательно сбалансировала набор данных, чтобы каждая группа была одинаково представлена. Это сделало задачу сложнее, но справедливее, вынуждая модели действительно учиться различиям в формулировках, а не просто отдавать предпочтение самым многочисленным сообществам. При тестировании модели правильно определяли сообщество примерно в 82% случаев — заметно лучше случайного угадывания, которое дало бы правильный ответ лишь в одном из четырёх случаев.

Открывая «чёрный ящик» ИИ

Одной из главных проблем технологий в области психического здоровья является то, что компьютерные системы могут выглядеть как загадочные «чёрные ящики», давая предсказания без понятных объяснений. Чтобы справиться с этим, исследователи использовали подход под названием LIME, который показывает, какие слова подталкивали модель к тому или иному решению. Проще говоря, LIME скрывает или изменяет части поста и отслеживает, как меняется ответ модели. Если удаление слова, например «паника», внезапно меняет предсказанное сообщество, это слово считают важным. Повторяя этот процесс тысячи раз на многих постах, команда составила списки самых влиятельных слов для каждого сообщества и проверила, совпадают ли эти слова с тем, что клиницисты знают о каждом состоянии.

Figure 2
Figure 2.

Отличительные голосы для разных трудностей

Выявленные объяснения показали явные языковые паттерны. В сообществах по тревоге выделялись слова такие как «паника», «приступ», «беспокойство», часто связанные с физическими симптомами и внезапными вспышками страха. В постах о депрессии часто встречались термины «безнадежность», «никчёмность», «жизнь», «больше» (в смысле «больше не»), отражая глубокую печаль и ощущение, что всё не улучшится. В обсуждениях BPD ключевые слова смещались в сторону отношений и эмоций: «брошенность», «отношения», «привязанность», «fp» (сокращение от «favorite person» — «любимый человек», термин, распространённый в этих группах). В постах о биполярном расстройстве подчёркивались изменения настроения и термины лечения: «мания», «маниакальный», «гипомания», «настроение», а также названия препаратов, такие как «литий» и «ламиктал». Модели также показали, где условия перекрываются: например, посты о тревоге и депрессии могут оба сосредоточиваться на дистрессе и негативных переживаниях, что делает их легче перепутать — подобно тому, как это происходит в клинической диагностике.

От онлайн-постов к реальному воздействию

Для неспециалиста главный вывод таков: компьютеры могут надежно сортировать разговоры о психическом здоровье по темам и объяснять, какие слова влияют на их выбор, но при этом они по-прежнему не могут и не должны ставить диагнозы. Модели в этом исследовании скорее подобны библиотекарям для онлайн-пространств поддержки: они помогают проверить, соответствуют ли обсуждения в данном сообществе его заявленной направленности. Это может помочь модераторам поддерживать уместность разговоров и помочь исследователям или клиницистам лучше понять, как люди описывают свои трудности вне формальных приёмов. При тщательном человеческом контроле и внимании к приватности и стигме такие инструменты в будущем могут способствовать созданию более гостеприимных и лучше организованных онлайн-пространств для обсуждения психического здоровья.

Цитирование: Sánchez Rodríguez, I., Bianchi, J., Pinelli, F. et al. Understanding mental health discourse on Reddit with transformers and explainability. Sci Rep 16, 6796 (2026). https://doi.org/10.1038/s41598-026-35918-3

Ключевые слова: психическое здоровье, социальные сети, Reddit, объяснимая ИИ, классификация текста