Clear Sky Science · zh

深度最大间隔矩阵分解

2026-03-22 · 返回目录

为什么更聪明的推荐很重要

从电影之夜到在线购物，我们依赖数字平台来猜测我们接下来可能喜欢什么。这些猜测来自从我们过去选择和评分中学习的推荐算法。但人们的口味复杂而混乱，很少遵循简单模式。本文提出了一种建模这些复杂口味的新方法，称为深度最大间隔矩阵分解（Deep MMMF），旨在将零散、不完整的评分数据转化为更清晰、更可靠的推荐。

当今推荐器通常如何工作

许多现代推荐系统围绕一种称为矩阵分解的技术构建。想象一个巨大的表格，行是用户、列是物品，每个单元格如果存在评分就记录评分。矩阵分解将这个巨大且稀疏的表压缩为两个较小的映射：一个描述用户的隐含偏好，另一个描述物品的隐含特征。当系统要预测某个用户对未见过的物品可能给出多少分时，它将把用户的隐含偏好向量与物品的隐含特征向量结合并转换为一个分数。这一思想的经典变体曾为电影、商品和音乐等知名系统提供支撑。

从直线到弯曲的偏好

一种有影响力的方法是最大间隔矩阵分解（MMMF），它更进一步，将评分视为有序类别：一星比不上二星，二星又比不上三星，依此类推。MMMF 将物品表示为空间中的点，将用户表示为将该空间划分为不同评分区的平面（超平面）。每个区域对应不同的评分等级，该方法力图尽可能拉开这些划分面以减少相邻评分间的混淆。然而，由于这些划分面被要求为平坦且平行，模型只能表达简单、近似线性的口味模式。

对口味与物品的更深入观察

真实的偏好很少如此简单。考虑三个观众：一个喜欢平衡、适度动作的电影，另一个想要高动作但强度低的片子，第三个则喜欢任何高动作电影。这类行为在电影空间中划出的是弯曲和不规则的边界，而不是整齐的平行切片。Deep MMMF 的做法是在保留熟悉的 MMMF 骨架之上，为用户、物品和评分相关表示引入深度神经网络。首先，模型像 MMMF 一样构建标准的紧凑嵌入表示用户、物品和评分阈值。然后，独立的神经模块通过多层非线性函数变换这些嵌入，将评分边界弯曲成更丰富的形状，同时不增加隐藏维度的数量。

实验揭示了什么

作者在三个常用数据集上测试了 Deep MMMF：MovieLens 1M、EachMovie 和一个亚马逊 Prime Pantry 商品集。他们考察了两种情形。在弱泛化下，系统预测被保留的用户—物品对的评分，但这些用户和物品在训练中都曾出现过。在强泛化下，系统面对全新的用户，这些用户的历史评分未用于拟合主模型，因此系统必须从零开始快速推断他们的偏好。在两种情形和全部数据集上，Deep MMMF 在预测误差上始终优于包括经典 MMMF、概率因子分解模型以及若干深度学习推荐器在内的多种领先方法。统计检验表明，这些改进并非偶然。

为什么这种方法有前景

通过在保持原始隐藏表示尺寸的同时加入灵活的非线性变换，Deep MMMF 清晰地区分了“更多维度”和“更具表达性的函数”这两件事。这让人更容易看出性能提升确实源于更好地建模复杂偏好模式，而不是仅仅来自更大的模型。结果表明，推荐系统可以更好地尊重评分的自然顺序和人类偏好的纠结性，同时不牺牲可解释性或效率。在实际层面，这意味着基于像 Deep MMMF 这样的思想构建的未来推荐器，尤其在用户口味不沿简单直线变化时，可能在电影、购物等领域提供更准确、更个性化的建议。

引用: Kumar, S., Kagita, V.R., Kumar, V. et al. Deep maximum margin matrix factorization. Sci Rep 16, 14518 (2026). https://doi.org/10.1038/s41598-026-44839-0

关键词: 推荐系统, 协同过滤, 深度学习, 矩阵分解, 用户评分