Clear Sky Science · pt

Uma abordagem de clustering neutrosófica para lidar com a incerteza em recomendações para usuários "ovelha‑cinza"

· Voltar ao índice

Por que algumas pessoas recebem recomendações estranhas

Serviços de streaming e plataformas de compras frequentemente parecem nos “conhecer”, mas para muitas pessoas as sugestões ainda acertam pouco. Este artigo examina um grupo complicado de usuários cujos gostos não se alinham com a maioria e mostra como abraçar a incerteza — ao invés de ignorá‑la — pode melhorar dramaticamente o que é recomendado a essas pessoas.

Os usuários que confundem motores de recomendação

A maioria dos sistemas de recomendação aprende a partir de padrões da massa: “pessoas como você também gostaram destes filmes, livros ou músicas.” Isso funciona bem quando seus gostos são semelhantes aos de um grande grupo. Mas alguns usuários, chamados de “ovelha‑cinza”, apreciam uma mistura de itens populares e itens incomuns que não se encaixa claramente em nenhum grupo. Suas avaliações são dispersas, o sistema não encontra vizinhos confiáveis, e as sugestões resultantes costumam ser imprecisas ou inconsistentes. O problema se agrava com dados esparsos: em um conjunto típico de filmes, mais de 90% dos pares usuário–filme possíveis não têm avaliação, de modo que usuários ovelha‑cinza acabam praticamente desaparecendo no ruído.

Figure 1
Figura 1.

Transformando incerteza em sinal útil

Os autores propõem enfrentar essa confusão diretamente, modelando explicitamente a incerteza no comportamento do usuário. Eles usam uma estrutura lógica chamada raciocínio “neutrosófico”, que representa o encaixe de cada usuário em um cluster em três partes: o quanto ele combina (verdade), o quanto o encaixe é incerto (indeterminação) e o quanto claramente ele não pertence (falsidade). Em vez de forçar cada pessoa a um único grupo bem definido, seu agrupamento neutrosófico k‑means permite que os usuários tenham pertences parciais e até ambíguos. O cluster com maior ambiguidade geral torna‑se o grupo de “ovelha‑cinza”: pessoas cujos gostos são difíceis de definir, mas que é importante não ignorar.

Um caminho de duas pistas para recomendações

Uma vez que os usuários são divididos em clusters mainstream e ovelha‑cinza, o sistema os trata de forma diferente. Para usuários típicos, utiliza‑se um método padrão de filtragem colaborativa baseado em itens: os itens são comparados entre si com base em como as pessoas os avaliaram, e o usuário recebe recomendações que se parecem com o que já gosta. Para usuários ovelha‑cinza, aplica‑se o mesmo método baseado em itens, mas somente após terem sido cuidadosamente isolados pela etapa de agrupamento sensível à incerteza. Essa camada extra garante que, quando o sistema busca padrões, ele compare cada usuário ovelha‑cinza com itens e padrões de avaliação que refletem suas preferências únicas e dispersas, em vez de diluí‑los na média da maioria. Os experimentos mantêm as configurações de recomendação constantes, de modo que quaisquer ganhos podem ser atribuídos à melhor identificação dos usuários ovelha‑cinza, e não a ajustes de parâmetros.

Figure 2
Figura 2.

Quão melhor isso realmente fica?

Os autores testam sua estrutura em conjuntos de dados conhecidos para filmes (MovieLens 100K e 1M) e depois a estendem para livros (Book‑Crossing) e música (Last.fm). Em comparação com um método de agrupamento suave popular (fuzzy c‑means) e vários híbridos avançados, sua abordagem neutrosófica consistentemente alcança menores erros de predição e maior sucesso em selecionar itens que os usuários ovelha‑cinza realmente gostam. Por exemplo, no conjunto MovieLens 100K, precisão e recall para o cluster ovelha‑cinza atingem cerca de 89% e 91%, com erros de avaliação visivelmente menores. O método também supera vários recomendadores por deep learning quando avaliado especificamente nos usuários ovelha‑cinza, apesar de usar uma arquitetura mais simples e transparente. A vantagem chave não é poder computacional bruto, mas o tratamento explícito da incerteza como um sinal de primeira classe.

O que isso significa para usuários do dia a dia

Em termos simples, este trabalho demonstra que reconhecer “não tenho certeza sobre este usuário” pode ser mais poderoso do que fingir que a incerteza não existe. Ao abrir um caminho dedicado para pessoas cujos gostos não se encaixam em moldes padrão, o sistema proposto recupera um público negligenciado e oferece a ele recomendações mais precisas, diversas e satisfatórias. Embora o estudo atual se concentre em avaliações em vez de conteúdo rico como textos ou imagens, e principalmente em ovelha‑cinza em vez de todos os usuários, ele oferece uma receita prática: construir pipelines de recomendação que detectem ambiguidade, a tratem explicitamente e a usem para orientar como as sugestões são geradas. Para quem já pensou “essas recomendações não são realmente eu”, essa mudança pode tornar sistemas futuros muito mais pessoais e justos.

Citação: Samir, D., El Reheem, E.A., Darwish, S.M. et al. A neutrosophic clustering approach to handle recommendation uncertainty for gray sheep users. Sci Rep 16, 9663 (2026). https://doi.org/10.1038/s41598-026-41651-8

Palavras-chave: sistemas de recomendação, usuários ovelha‑cinza, modelagem de incerteza, agrupamento neutrosófico, filtragem colaborativa