【机器学习】推荐系统

推荐模型如何进行推荐将取决于您拥有的数据类型。如果您只拥有过去发生的交互数据，您可能有兴趣使用协作过滤。如果您有描述用户及其与之交互过的物品的数据（例如，用户的年龄、餐厅的菜系、电影的平均评价），您可以通过添加内容和上下文过滤，对当前给定这些属性下新交互的可能性进行建模。推荐系统中最为主流与经典的技术之一是（Collaborative Filtering），它是基于这样的假设：用户如果在过去对某些

noobiee

2168人浏览 · 2022-11-28 09:39:22

noobiee · 2022-11-28 09:39:22 发布

传统的方法: 矩阵分解法MF (matrix factorization)

1. 矩阵因子分解（MF）

推荐系统评分预测任务可看做是一个矩阵补全（Matrix Completion）的任务，即基于矩阵中已有的数据（observed data）来填补矩阵中没有产生过记录的元素（unobserved data）。推荐系统的评分预测场景可看做是一个矩阵补全的游戏，矩阵补全是推荐系统的任务，矩阵分解是其达到目的的手段。因此，矩阵分解是为了更好的完成矩阵补全任务（假设UI矩阵是低秩的）

MF方法的局限性：
在低维的隐式空间中建模用户、项目的embedding，而且使用简单、不够灵活的内积的方式来估计复杂的用户-项目之间的关系（内积的方式是对用户、项目向量中元素的简单的线性组合）。虽然可以通过增加隐式空间的维度来提升推荐效果，但是在数据稀疏（Sparse）的情况下，会导致过拟合。

2. SVD奇异值分解

SVD分解的形式为3个矩阵相乘，左右两个矩阵分别表示用户/项目隐含因子矩阵，中间矩阵为奇异值矩阵并且是对角矩阵，每个元素满足非负性，并且逐渐减小。因此我们可以只需要前 k 个因子来表示它。

如果想运用SVD分解的话，有一个前提是要求矩阵是稠密的，即矩阵里的元素要非空，否则就不能运用SVD分解。很显然我们的任务还不能用SVD，所以一般的做法是先用均值或者其他统计学方法来填充矩阵，然后再运用SVD分解降维。

3. FunkSVD算法（LFM）

SVD首先需要填充矩阵，然后再进行分解降维，同时由于需要求逆操作（复杂度O(n^3)），存在计算复杂度高的问题。那么我们能不能避开稀疏问题，同时只分解成两个矩阵呢？

这种简化的矩阵分解不再是分解为三个矩阵，而是分解为两个低秩的用户和物品矩阵，其实就是把用户和物品都映射到一个 k 维空间中，这个 k 维空间对应着 k 个隐因子，我们认为用户对物品的评分主要是由这些隐因子影响的，所以这些隐因子代表了用户和物品一部分共有的特征，在物品身上表现为属性特征，在用户身上表现为偏好特征。
FunkSVD采用了线性回归的思想将矩阵R分解为P和Q。我们的目标是让用户的评分和用矩阵乘积得到的评分残差尽可能的小，也就是说，可以用均方差作为损失函数，来寻找最终的P和Q。即通过 User-Item 评分信息来学习到的用户特征矩阵 P 和物品特征矩阵 Q，通过重构的低维矩阵预测用户对物品的评分