【数据应用案例】阿里巴巴长标题压缩 - 代码天地

【数据应用案例】阿里巴巴长标题压缩

其他 2018-08-29 10:11:17 阅读次数: 0

案例来源：@阿里巴巴机器智能

案例地址：https://mp.weixin.qq.com/s/m31WKGLIe6P2bA02b8uV8Q；https://arxiv.org/pdf/1801.01725.pdf

0. 背景：阿里巴巴平台上的商户为了提高用户搜索中的召回率，会在标题堆砌很多关键词。在手机淘宝的搜索结果中，需要对长标题进行压缩，提高C端用户的体验，提高点击率

1. 目标：对搜索结果长标题进行压缩

2. 已有方法：

1）抽取式摘要

a. 贪心方法

b. 基于图的方法

c. 基于约束的优化方法

2）生成式摘要

3. 本文提出的多任务学习方法

1）两个Sequence to Sequence任务：

a. 主任务：商品标题压缩，采用Pointer Network模型，通过attention机制选取原始标题的关键字输出。训练数据是女装类目下的商品原始标题和手淘推荐频道达人改写的商品短标题

b. 辅助任务：搜索query生成，由商品原始标题生成搜索query，采用带attention机制的encoder-decoder模型。训练数据是女装类目下的商品原始标题和对应的引导成交的用户搜索query

2）两个任务共享编码网络参数，并对两者的对原始标题的注意力分布进行联合优化，使得两个任务对于原始标题中重要信息的关注尽可能一致

3）学习框架

4. 效果评估：

1）在真实线上环境中进行了AB测试，相比线上原来的ILP压缩方法，本文提出的多任务学习方法在CTR和CVR两个指标上分别有2.58%和1.32%的提升

2）示例：本文方法Agree-MTL

猜你喜欢

转载自blog.csdn.net/u013382288/article/details/81702692

【数据应用案例】阿里巴巴长标题压缩

【数据应用案例】阿里巴巴客服助手_人机协作提高客服效率

【数据应用案例】阿里巴巴基于改进注意力循环控制门的品牌个性化排序系统

标题摘要:在阿里巴巴构建新一代数据中心的历程

阿里巴巴的FastJson数据解析介绍

阿里巴巴的数据池DRUID

阿里巴巴大数据之路

阿里巴巴的json的数据转换

阿里巴巴JStorm

阿里巴巴Druid

阿里巴巴的fastjson

阿里巴巴笔试

阿里巴巴

阿里巴巴的故事

阿里巴巴的面试

阿里巴巴 Alibaba

阿里巴巴20200221

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

阿里巴巴智能语音交互技术与应用

Work@Alibaba 阿里巴巴的企业应用构建之路

阿里巴巴的云原生应用开源探索与实践

图神经网络（AliGraph）在阿里巴巴的发展与应用

阿里巴巴的 Kubernetes 应用管理实践经验与教训

大数据之路、阿里巴巴大数据实践读书笔记 --- 第十六章、数据应用

阿里巴巴运营--标题优化的六大构建法

利用用户搜索词生成商品标题信息——阿里巴巴IDST

Java“牵手”阿里巴巴商品详情数据，阿里巴巴商品详情接口，阿里巴巴API接口申请指南

分享《大数据之路：阿里巴巴大数据实践》+PDF+阿里巴巴数据技术及产品部

分享+《大数据之路：阿里巴巴大数据实践》+阿里巴巴数据技术及产品部

阿里巴巴Druid数据源的配置与使用

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)