16.推荐系统
16 推荐系统
16.1 问题形式化
在机器学习领域,对于一些问题存在一些算法, 能试图自动地替你学习到一组优良的特征。通过推荐系统(recommender systems),将领略一小部分特征学习的思想。
假使有 5 部电影,3部爱情片、2部动作片。 4 个用户为其中的部分电影打了分。现在希望构建一个算法,预测每个人可能给没看过的电影打多少分,以此作为推荐的依据。

下面引入一些标记:
16.2 基于内容的推荐系统
(1)定义
在一个基于内容的推荐系统算法中,假设对于我们希望推荐的东西有一些数据,是这些东西的特征。
现在假设每部电影都有两个特征,
则每部电影都有一个特征向量,如
下面我们采用线性回归模型,针对每一个用户都训练一个线性回归模型,如
对于用户 j 和电影 i,我们预测其评分为:

(2)代价函数
对于单个用户 j,类比之前学习的线性回归和正则化,我们可以写出下面的代价函数,但这里我们去掉了

上面的代价函数只是针对一个用户的,为了学习所有用户,我们将所有用户的代价函数求和:

如果我们要用梯度下降法来求解最优解,我们计算代价函数的偏导数后得到梯度下降的更新公式为:

16.3 协同过滤
在之前的基于内容的推荐系统中,使用电影的特征,训练出了每一个用户的参数。相反地,如果拥有用户的参数,可以学习得出电影的特征。


但是如果既没有用户的参数,也没有电影的特征,这两种方法都不可行了。可以使用协同过滤算法,同时学习这两者。
优化目标便改为同时针对

16.4 协同过滤算法
通过分析前两节中的代价函数,我们可以发现粉色框表示对所有有评分的<电影-用户>对进行误差计算,我们可以将两个式子合并成最下面的一个式子,即为协同过滤算法的代价函数:
注:在协同过滤从算法中,通常不使用方差项,如果需要的话,算法会自动学得。

算法流程:
1.初始化
2.使用梯度下降算法最小化代价函数
3.在训练完算法后,通过计算
通过这个学习过程获得的特征矩阵包含了有关电影的重要数据,这些数据不总是人能读懂的,但是可以用这些数据作为给用户推荐电影的依据。

16.5 向量化:低秩矩阵分解
协同过滤算法的向量化实现
举例:
1)给出一件产品,能否找到与之相关的其它产品。
2)一位用户最近看上一件产品,有没有其它相关的产品可以推荐给他。
现在有5部电影,4位用户,矩阵 Y 就是一个 5 行 4 列的矩阵,存储每个用户对每个电影的评分数据:

通过使用
因为

现在已经学习到了特征参数向量,那么可以使用这些向量做一些别的事情,比如度量两部电影之间的相似性。例如,如果一位用户正在观看电影

16.6 推行工作上的细节:均值归一化 Mean Normalization
现在新增一个用户 Eve,她没有为任何电影评分,那么我们以什么为依据为 Eve 推荐电影呢?
如果根据之前的模型,因为她没有打分,代价函数第一项为0。算法目标变为最小化最后一项,最后得到

首先需要对结果 Y 矩阵进行均值归一化处理,将每一个用户对某一部电影的评分(即整个评分矩阵)减去所有用户对该电影评分的平均值
然后利用这个新的 Y 矩阵来训练算法。 最后在预测评分时,需要在预测值的基础上加回平均值,即预测值等于
