Gavin老师Transformer直播课感悟 - 基于Retrieval的具有Fine-grained架构的对话系统(二） - 代码天地

Gavin老师Transformer直播课感悟 - 基于Retrieval的具有Fine-grained架构的对话系统(二）

其他 2021-12-10 20:26:08 阅读次数: 0

一、Related work介绍

最近的研究多集中于在基于retrieval的多轮对话系统中，当一个包含多轮对话的上下文被提供时，系统应该如何选择最合适的响应，如使用BERT对上下文序列进行编码，产生一个dense vector，然后把这个vector同一组可选响应的矩阵进行相乘，比较它们的相关度，然后使用softmax得到概率分布，从而选出一个概率最高的作为系统的响应。在对比这些研究时发现，有一种方式是使用称为IRC语料库的基准数据集和一个基于RNN网络的模型，另一种方式是使用一种基于dual encoder的模型来试图有效地对上下文进行编码和使用LSTM和CNN作为encoder对响应部分进行编码，这里提到的dual encoder可以看做是有左右两个encoder部分，使用左侧对上下文进行编码，而使用右侧对响应部分进行编码，上下文是指当前用户和系统交互的内容，通过编码形成一个dense vector。随着注意力机制的出现，注意力机制被用于对话系统来选择系统响应。譬如通过对话中的多个交互blocks来在上下文和响应之间进行一种深度的交互，从而通过对话状态控制器来改善训练表现。

论文提到使用开源的BERT模型，具有12层，12个注意力头，768维度的hidden state。BERT有两个训练目标：MLM和NSP，MLM使用掩码机制来进行预测，而NSP是针对给定的两个文本序列A和B，训练模型来决定序列B是否在序列A之后（指位置是否“相邻”），模型把A和B作为输入并使用token [SEP] 进行分隔，然后使用segment embedding 的

猜你喜欢

转载自blog.csdn.net/m0_49380401/article/details/121864176

Gavin老师Transformer直播课感悟 - 基于Retrieval的具有Fine-grained架构的对话系统(二）

Gavin老师Transformer直播课感悟 - 基于Retrieval的Fine-grained架构的对话系统

Gavin老师Transformer直播课感悟 - 基于Transformer端到端的任务对话系统解密

Gavin老师Transformer直播课感悟 - DIET:基于Transformer的轻量级多任务NLU系统（二）

Gavin老师Transformer直播课感悟 - Transformer的Task-oriented对话系统抗干扰能力实验

Gavin老师Transformer直播课感悟 - DIET:基于Transformer的轻量级多任务NLU系统（三）

Gavin老师Transformer直播课感悟 - DIET:基于Transformer的轻量级多任务NLU系统（一）

Gavin老师Transformer直播课感悟 - 基于Transformer的端到端SimpleTOD实验分析

Gavin老师Transformer直播课感悟 - 使用Transformer构建具有抗干扰能力的Task-oriented对话系统

Gavin老师Transformer直播课感悟 - BERT多任务Fine-tuning案例实战

Gavin老师Transformer直播课感悟 - BERT分类任务案例实践及Fine-tuning

Gavin老师Transformer直播课感悟 - NLP信息提取中的CRF Modeling详解（二）

Gavin老师Transformer直播课感悟 - 基于Transformer的Scalable对话状态管理模型BERT-DST详解

Gavin老师Transformer直播课感悟 - 基于Transformer的多轮对话机器人四要素解密

Gavin老师Transformer直播课感悟 - Transformer基于Bayesian思想拥抱数据的不确定性

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目Policies Data详解（七十二)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目NLU Data详解（七十一)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目NLU Pipeline、Dialogue Policies、及多意图识别（七十)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目微服务源码逐行解密（六十九)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目微服务源码逐行解密（六十八)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目FormValidationAction机制及源码逐行解密（七十六)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目Slots解析、Slot Validation Action剖析（七十四)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目架构、运行测试、流程分析及Rasa interactive实验分析（六十)

Gavin老师Transformer直播课感悟 - Rasa对话机器人Debugging项目实战之电商零售对话机器人运行流程调试全程演示(七十八)

Gavin老师Transformer直播课感悟 - Rasa对话机器人Debugging项目实战之电商零售对话机器人运行流程调试演示(七十九)

Gavin老师Transformer直播课感悟 - 图解Rasa对话机器人项目实战之教育领域Education Bot项目及综合调试Debugging实战解密（七十七)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目Session自定义、Rich Response解密及案例剖析（七十三)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot开发事件驱动Event三层设计机制、全生命周期及源码详解（六十七)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot微服务FormValidationAction实验剖析及Form验证源码详解（六十六)

Gavin老师Transformer直播课感悟 - Rasa对话机器人项目实战之教育领域Education Bot项目Form解析及自定义全解（七十五)

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)