• 广告中的计算问题
– Find the best match between a given user u, in
a given context c, and a suitable ad a.
T
max a ∑i=1 ROI(ai, ui, ci )
• 从优化角度来看• 从系统角度来看
– 特征提取:受众定向– 候选查询:实时索引
– 微观优化:CTR预测– 特征存储:No-sql技术
– 宏观优化:竞价市场机制– 离线学习:Hadoop
– 受限优化:在线分配– 在线学习:流计算
– 强化学习:探索与利用– 交易市场:实时竞价
– 个性化重定向:推荐技术,广告包括推荐技术,一般意义上的推荐是同类事物,并且 "Downstream" 。
在线广告计算的主要挑战1
• 大规模 (Scale)
– 百万量级的页面,十亿量级的用户,需要被分析处理
– 高并发在线投放系统 (例: Rightmedia每天处理百亿次广告交易)
– Latency的严格要求 (例: ad exchange要求竞价在100ms内返回)
• 动态性 (Dynamics)
– 用户的关注和购物兴趣非常快速地变化
• 丰富的查询信息 (Rich query)
– 需要把用户和上下文中多样的信号一起用于检索广告候选
• 探索与发现 (Explore & exploit)
– 用户反馈数据局限于在以往投放中出现过的(a, u, c)组合,需要主
动探索未观察到的领域,以提高模型正确性