Clear Sky Science · ru

Неутрософический подход к кластеризации для учета неопределенности рекомендаций для «серых овец»

· Назад к списку

Почему некоторым людям приходят странные рекомендации

Сервисы потокового видео и торговые платформы часто создают ощущение, что они «знают» нас, но для многих пользователей предложения всё равно промахиваются. В этой статье рассматривается сложная группа пользователей, чьи вкусы не укладываются в общие шаблоны, и показано, как принятие неопределенности — вместо её игнорирования — может принципиально улучшить рекомендации для таких людей.

Пользователи, которые сбивают с толку рекомендательные системы

Большинство систем рекомендаций учатся на закономерностях толпы: «люди, похожие на вас, также оценили эти фильмы, книги или песни». Это работает, когда ваши предпочтения совпадают с большой группой других людей. Но есть пользователи, называемые «серые овцы», которые любят смесь мейнстрима и необычных элементов, не соответствующую явно ни одной группе. Их оценки разбросаны, система не может найти надежных соседей, и в итоге рекомендации часто оказываются неточными или непоследовательными. Проблему усугубляет разреженность данных: в типичном наборе данных по фильмам более 90% всех возможных пар пользователь–фильм не имеют оценки, поэтому «серые овцы» фактически теряются в шуме.

Figure 1
Figure 1.

Преобразование неопределенности в полезный сигнал

Авторы предлагают прямо работать с этой неопределенностью, моделируя её в поведении пользователей. Они используют логическую парадигму, называемую «неутрософической» логикой, которая описывает принадлежность пользователя к кластеру тремя составляющими: насколько хорошо он подходит (истина), насколько неясна эта принадлежность (инденгетность), и насколько явно он кластеры не принадлежит (ложь). Вместо того чтобы принудительно относить каждого человека к единственной чистой группе, их неутрософическая k‑средних позволяет пользователям иметь частичные и даже неоднозначные членства. Кластер с наибольшей общей неопределенностью выделяется как группа «серых овец»: люди с трудноопределимыми вкусами, которых важно не игнорировать.

Двухполосный путь для рекомендаций

После разделения пользователей на мейнстримные и «серые овцы» система обрабатывает их по‑разному. Для типичных пользователей применяется стандартный метод коллаборативной фильтрации на основе предметов: предметы сравниваются друг с другом по оценкам пользователей, и человек получает рекомендации, похожие на то, что ему уже нравится. Для «серых овец» тот же предметно-ориентированный метод применяется, но только после того, как они были тщательно выделены шагом кластеризации, учитывающей неопределенность. Этот дополнительный уровень гарантирует, что при поиске закономерностей система сравнивает каждого пользователя «серую овцу» с предметами и паттернами оценок, отражающими их уникальные, разбросанные предпочтения, а не усредняет их внутри большинства. Эксперименты выполняются при фиксированных настройках рекомендаций, поэтому любые улучшения можно отнести к лучшему выделению «серых овец», а не к подстройке параметров.

Figure 2
Figure 2.

Насколько это действительно лучше?

Авторы протестировали свою схему на известных наборах данных по фильмам (MovieLens 100K и 1M), а затем расширили её на книги (Book‑Crossing) и музыку (Last.fm). По сравнению с популярным методом мягкой кластеризации (fuzzy c‑means) и несколькими продвинутыми гибридными алгоритмами их неутрософический подход последовательно демонстрирует меньшие ошибки предсказания и большую точность в выборе элементов, которые действительно нравятся «серым овцам». Например, в наборе MovieLens 100K точность и полнота для кластера «серых овец» достигают примерно 89% и 91% соответственно, при заметно меньших ошибках в оценках. Метод также превосходит несколько рекомендателей на основе глубокого обучения при оценке именно по «серым овцам», несмотря на более простую и прозрачную архитектуру. Ключевое преимущество — не грубая вычислительная мощь, а явная обработка неопределенности как полноценного сигнала.

Что это означает для обычных пользователей

Проще говоря, работа показывает, что признание «я не уверен в этом пользователе» может быть эффективнее притворства, будто неопределенности нет. Выделив отдельный путь для людей, чьи вкусы не укладываются в стандартные формы, предлагаемая система возвращает упущенную аудиторию и предоставляет ей рекомендации, которые точнее, разнообразнее и более удовлетворительны. Хотя текущее исследование сосредоточено на оценках, а не на богатом контенте вроде текста или изображений, и больше фокусируется именно на «серых овцах», чем на всех пользователях, оно предлагает практический рецепт: строить конвейеры рекомендаций, которые обнаруживают неоднозначность, явно её учитывают и используют для руководства тем, как формируются предложения. Для тех, кто когда‑либо думал «эти рекомендации не про меня», такой подход может сделать будущие системы гораздо более персональными и справедливыми.

Цитирование: Samir, D., El Reheem, E.A., Darwish, S.M. et al. A neutrosophic clustering approach to handle recommendation uncertainty for gray sheep users. Sci Rep 16, 9663 (2026). https://doi.org/10.1038/s41598-026-41651-8

Ключевые слова: системы рекомендаций, пользователи «серые овцы», моделирование неопределенности, неутрософическая кластеризация, коллаборативная фильтрация