Transformer——注意力机制

企业开发 2023-04-09 07:11:17 阅读次数: 0

1 注意力机制

如下图所示，婴儿在干嘛吗？

判断婴儿再关注什么？颜色深表示主要注意力，颜色浅表示不那么注意。

注意力机制公式：

$Attention(Q,K,V) = softmax(\frac{Q\cdot K^{T}}{\sqrt{d_{k}}})V$

那么根据上述婴儿图篇可以抽象为：

将图片的区域划分为四块，分别为左上、左下、右上、右下（Key1~4）；（V1~4代表值向量）

step1: 首先Key和Query做点乘，点乘结果越大其相似度越大

step2: 将step1的结果和对应的V矩阵相乘，得到矩阵相加。即为注意力机制的和。

2 Transfomer中的注意力

2.1 在只有单词的向量的情况下，如何获取QKV?

如下图所示：输入向量X1、X2分别于 $W^{^{Q}} \: \; W^{^{K}}\; \; W^{^{V}}$ 相乘-----》---》--》得到q、k、v

2.2 计算QK的相似度，得到attention

如上述注意力机制公式一样，点乘得到加权和

实际代码使用矩阵相乘，方便并行

多头注意力机制，把原始数据分割为不同空间，分别计算再合在一起输出

猜你喜欢

转载自blog.csdn.net/maggieyiyi/article/details/126989443

Transformer——注意力机制

注意力机制----transformer中注意力机制

自注意力机制和transformer

简单理解Transformer注意力机制

注意力&Transformer

深度学习——机器翻译、注意力机制、transformer

学习笔记-Transformer中注意力机制

注意力机制----Multi-Head Attention 和 transformer

Transformer自注意力机制发展历程(原理)

Transformer多头注意力机制实现数字预测（pytorch）

从零开始快速入门Transformer注意力机制

图解transformer中的自注意力机制

注意力机制——Spatial Transformer Networks（STN）

人工智能课程笔记：注意力机制 Transformer

图解transformer中的自注意力机制（备忘）

注意力机制

【Transformer 相关理论深入理解】注意力机制、自注意力机制、多头注意力机制、位置编码

Transformer：注意力机制（attention）和自注意力机制（self-attention）的学习总结

新注意力机制！LITv2：具有HiLo注意力的快速视觉Transformer

解码Transformer：自注意力机制与编解码器机制详述与代码实现

自注意力机制与注意力机制

注意力的厉害模型transformer学习

关于Transformer中注意力的理解

注意力机制（一）

注意力机制（二）

注意力机制【译】

注意力机制笔记

注意力机制Attention

attention注意力机制

注意力机制的介绍

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

更多

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)