标签打分规则

标签都是一些短文本,计算机无法直接使用,需将标签转化为计算机可识别的语言,对所有标签进行归一化计算,这就涉及到了标签的打分机制。

一般,标签打分规则主要考虑因素如下:

  1. 内容权重限定打分范围。标签内容本身的都有一个自带权重,用户浏览、搜索、收藏、下单、购买等不同行为对用户而言有着不同的重要性,该权重值一般由运营人员或业务来决定,并且取值要有一个固定区间,不能随意变化。
  2. 时间衰减因子。一般情况下,用户的某个行为对用户画像的影响会随着时间进行衰减,考虑采用牛顿冷却定律。例如:某个某用户5个月前浏览了某款珠宝,但是最近再没看过珠宝。显然,对此用户进行打标签时,我们不能直接给此用户打上“喜欢珠宝”的标签,“5个月前浏览了某款珠宝”这个行为分值就应该随时间降低。
  3. 每天标签数量衰减系数。考虑到用户某一天内对某一标签的集中行为有可能会拉偏此用户的兴趣点,因此添加了标签数量的衰减,可采用TF-IDF计算标签权重。例如:某用户某一天内突然看了5场电影,如果不加特殊处理,就给此用户打上“喜欢看电影”的标签,显然会偏离此用户的本来的兴趣点,因此,我们需要降低“突然看了5场电影”的行为数量对用户打标签的影响。

转换为公式:

标签权重=时间衰减因子×每天标签数量衰减系数×内容权重

参考:

 

猜你喜欢

转载自blog.csdn.net/u012998680/article/details/116308037