版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/aFeiOnePiece/article/details/47674359
本文内容属于 Andrew Ng的《机器学习》公开课笔记,大部分截图均来自Andrew Ng的课件
所谓基于内容的推荐,就是说我们的item具备某些属性attrs,然后我们可以通过某个user的历史评分记录,计算出该user对各种 属性 attr的喜好程度,从而可以给user推荐具备他喜欢的attr的item
比如说,每一部电影,都由 浪漫和动作 两种属性,如下图
我们以Alice为例,她对前2个romance风格的电影评分很高,对最后2部 action类型的电影评分为0,那么第3部电影的属性列表表示该电影时romance风格的,是不是可以预测 Alice对该电影的评分可能比较高呢?!当然!
其实对于 Alice这个用户而言,就是一个我们已经熟知的 linear regression的问题。
X是电影的attrs向量,y是用户的评分。我们要求的theta就是user对各种attrs的偏好。
详见下图公式:
其算法,就是用 梯度下降法,每一步更新 theta即可,见下图,不用多说
思考一个问题:
item 的内在属性并不是什么时候都可以得到。就算有,按照一般人的思路,可能也得用大量的人力去填,而且还可能不准确。
下一节讲述的 collaborative filter,就是解决这个问题的强大工具.