版权声明:欢迎转载,请注明作者和出处 https://blog.csdn.net/baichoufei90/article/details/84655524
推荐分享
流量变现-广告
人
推荐核心:
匹配 相似性 : 人和人、物品和物品、用户特征和商品特征
排序
算法
- 协同过滤:数据要的少,效果可以 使用普遍
- 广义线性模型: 特征拟合,找用户特征
- 深度学习: 数据中自动找特征
- 强化学习: 人工干预很少,封闭系统。类似人主动学习。
趋势:
- 搜索和推荐融合
- AI和传统算法
- 隐私政策强时,数据少,就用小样本和端(实时记录)、云(历史记录)协统技术
协同过滤
矩阵分解
聚类
问题
-
稀疏,品类太多,用户购买同一个几率小
-
相似度度量:微信和陌陌对相似度权限贡献相同
-
可扩展性:计算量随着user item增加而增加O(m*n)
-
聚类
-
矩阵分解
user-item 交互信息中 矩阵分解来挖掘
冷启动、数据热点(流行)
广义线性
p(click|show) = w.x
比如逻辑回归,其实不是绝对线性,但是线性思维,所以叫广义线性
高维稀疏特征-
- ID型、离散型特征可用one-hot独热编码
- 特征组合,丰富特征
- 如果人工找的特征效果不好,就可以用机器方法找特征(GBDT)、特征组合学习-因子分解机(FM)、实时机器学习(流计算)
在线学习
FTRL(Google,2013)
特征学到了就直接丢掉了,不需要迭代学习
不会出现数据量一直增大导致学习计算量持续增长情况
实时推荐系统
基于树的特征挖掘
gbdt
深度学习
设计多个神经元,每个神经元都判断某个特征
比如多个神经元分别判断猫 眼睛 头 尾巴 体长等 ,如果达到某个数值的神经元超出了判断阈值,就认定这个物体是猫
问题:
- 高维稀疏特征不适用,因为有全连接,导致连接数太多
广度&深度学习模型
宽特征用LR
窄特征用DL
强化学习
样本少时可以用
建立 推荐引擎到环境(用户)的闭环
人特别容易变化,所以强化学习是未来趋势
目前效果还不太好,收敛速度慢,生产环境使用很少
推荐指标
- 用户满意度 点击率 转化率
- 多样性 推荐之间差异化 不相似
- 准确性
- 新颖性
- 鲁棒性 反作弊 稳健性
- 覆盖率 长尾物品和用户
- 惊奇性
- 实时性
- 用户信任度-推荐理由?
除了固定的一些数据指标,还可以加上一些用户问卷,比如给用户交互点击是否喜欢推荐的