Clear Sky Science · ru

DeepSentRec: система рекомендаций продуктов с учётом настроений на основе глубокого обучения

2026-03-30 · Назад к списку

Почему умные предложения имеют значение

Каждый раз, когда вы делаете покупки онлайн, залипаете на сериал или листаете отзывы о ресторанах, невидимые алгоритмы решают, что вы увидите дальше. При этом эти системы часто упускают важный момент: как вы действительно относитесь к тому, что покупаете или смотрите. В этой работе представлена DeepSentRec — новая структура рекомендаций, которая пытается «прочесть» не только то, по чему вы кликнули, но и тон ваших письменных отзывов — ваше возбуждение, разочарование или равнодушие — и затем использует этот эмоциональный сигнал, чтобы более человечно подбирать последующие предложения.

От звёзд к настоящим чувствам

Большинство существующих рекомендательных движков опираются прежде всего на числа: рейтинг в звёздах, прошлые клики и историю покупок. Они рассматривают пользовательские отзывы в основном как длинный, неструктурированный текст, который трудно использовать в масштабе. В результате упускаются богатые подсказки, например, был ли трёхзвёздочный отзыв написан с неохотой или с умеренной похвалой. Ранние исследования показали, что включение тональности — положительного, нейтрального или отрицательного настроя в тексте — может улучшить персонализацию, но многие системы по-прежнему добавляют это как поверхностную функцию, а не делают центральной частью процесса формирования и ранжирования рекомендаций.

Три «мозга», работающие вместе

DeepSentRec спроектирована как трикомпонентный конвейер, который интегрирует эмоции, поведение и обучение на основе обратной связи в один цикл. Сначала модуль тональности SentimentBERT анализирует текст отзывов и создаёт тонкую эмоциональную «отпечаток» для каждого отзыва, а не просто простую оценку «за» или «против». Затем гибридный модуль рекомендаций объединяет два взгляда на мир: людей, которые вели себя как вы (коллаборативная фильтрация), и товары, чьи отзывы несут схожие смыслы и чувства (семантическое сходство). Наконец, модуль обучения ранжированию на основе обучения с подкреплением непрерывно переставляет порядок предложенных товаров в зависимости от реакции пользователей — кликают они, покупают или игнорируют позиции.

Обучение на голосах множества людей

Чтобы проверить, действительно ли такая архитектура помогает людям находить более релевантные предметы, авторы обучили и оценили DeepSentRec на четырёх больших реальных наборах данных: отзывах о товарах Amazon, отзывах о заведениях Yelp, отзывах о фильмах IMDB и коллекции отзывов об электронной коммерции с Kaggle. До начала обучения текст тщательно очищается и разбивается на фрагменты, пригодные для современных языковых моделей. SentimentBERT сначала обучают на хорошо размеченных отзывах о фильмах, а затем дообучают на данных Amazon и Yelp, чтобы адаптироваться к разным стилям письма и доменам. Система также строит компактные представления того, как каждый пользователь взаимодействует с каждым продуктом, а затем сочетает их с текстовыми встраиваниями с учётом тональности, чтобы создать более полную картину вкусов.

Преобразование обратной связи в лучшее ранжирование

Самая отличительная часть DeepSentRec — то, что она рассматривает ранжирование как продолжающийся диалог, а не как статический расчёт. С помощью метода обучения с подкреплением Proximal Policy Optimization система трактует каждый ранжированный список как решение, а каждую реакцию пользователя — как награду или штраф. Клики, покупки и пропуски объединяются в единую оценку, которая поощряет модель выделять товары, способствующие долгосрочному вовлечению, а не только мгновенным кликам. Со временем политика ранжирования улучшается, пробуя разные порядки и сохраняючи те, которые приводят к более значимым взаимодействиям, таким как покупки или повторное использование.

Что показывают результаты для реальных пользователей

На наборах данных Amazon и Kaggle DeepSentRec последовательно превосходит традиционные методы, основанные только на прошлой активности или простом текстовом совпадении. Она даёт более высокую точность (большая доля верхних предложений действительно релевантна), лучшее покрытие (находится больше объектов, которые интересуют пользователей) и более сильные показатели качества ранжирования. Что важнее для реальных платформ — она повышает коэффициенты кликабельности и общий показатель вовлечённости, объединяющий разные виды реакции пользователей. Абляционные исследования — систематическое удаление компонентов — показывают, что каждая часть важна: моделирование тональности повышает точность, гибридная модель текста плюс взаимодействия улучшает покрытие, а обучатель с подкреплением дополнительно увеличивает частоту действий пользователей по рекомендациям.

Что это значит для повседневных рекомендаций

Проще говоря, исследование показывает: рекомендательные движки заметно улучшаются, когда они слушают то, что вы пишете в отзывах, так же внимательно, как и наблюдают за вашими кликами, и когда продолжают учиться на вашем свежем поведении, вместо того чтобы полагаться только на старые шаблоны. DeepSentRec демонстрирует, что сочетание эмоционального тона, контекста текста и непрерывной обратной связи может давать рекомендации, которые кажутся более актуальными, своевременными и персональными. Хотя текущая работа сосредоточена на англоязычных отзывах и офлайн-экспериментах, она указывает путь к новому поколению систем, которые адаптируются почти в реальном времени и могут быть расширены на несколько языков и доменов, потенциально делая цифровой опыт — от покупок до обучения — более соответствующим тому, как люди действительно чувствуют и ведут себя.

Цитирование: Kollu, S.R.P., Garapati, Y. DeepSentRec: a deep learning-based sentiment-aware product recommendation system. Sci Rep 16, 10580 (2026). https://doi.org/10.1038/s41598-026-45953-9

Ключевые слова: системы рекомендаций, анализ тональности, персонализация в электронной коммерции, глубокое обучение, обучение с подкреплением