Attention Is All You Need论文详解与理解

研究背景、动机

深度学习做NLP问题的方法,大多基本上是先将句子分词,然后将每个词转化为对应的词向量序列,于是每个句子就都对应一个词嵌入矩阵X=(x1,x2,...,xt)X=\left(x_1,x_2,{...,x}_t\right)X=

猜你喜欢

转载自blog.csdn.net/HowardEmily/article/details/107114108