Attention（注意力机制）的简单理解 - 代码天地

Attention（注意力机制）的简单理解

企业开发 2023-09-05 18:46:33 阅读次数: 0

Attention（注意力机制）

直白的理解：注意力机制，对于数据，我们有重要的数据和不重要的数据。在模型处理数据的过程中，我们如果只关注较为重要的数据部分，忽略不重要的部分，那训练的速度、模型的精度就会变得更好。
在这里插入图片描述

由图可知:我们作为人类，常常会聚焦于较为重要的内容上。

由此，Attention的主要目的，就是要模仿人类一样，学会聚焦重要的内容部分，查找到目标，并计算被查找目标的相似度。

计算过程

我们设立三个参数，Q,V,K。整个注意力机制的过程如下：

1.Q是最适合查找目标的

2.K是最适合接收查找的

3.V就是内容

4.Q(查找的目标), $K=k_1,k_2.....,k_n$ ,一般使用点乘Q，K，拿到Q和每一个K的相似值 $Q*k_n=s_n$ 。

5.做一层 $softmax(s_1,s_2,\cdots,s_n)=a_n$ 得到每一个查询对象的概率。

6.计算 $a_n*V=V'$ 事物的重要度，相似度计算,找到Q最相似的对象。
在这里插入图片描述

总结出的公式为： $Attention(Q,K,V)=softmax(\frac{Q*K_i}{\sqrt d_k})*V_i$
在这里插入图片描述

PS:为什么softmax中需要除以一个 $\sqrt d_k$

softmax（）作为归一化的处理，当得到的概率差距较大时如（0.05,0.95），最后所点乘出的V的差距就会过大。

一般在注意力机制中，我们常常使用 $\frac{512}{8}$ 作为处理。

猜你喜欢

转载自blog.csdn.net/m0_51581537/article/details/129317107

Attention（注意力机制）的简单理解

简单理解反向注意力(Reverse Attention)机制

注意力机制Attention

attention注意力机制

Attention 注意力机制

Attention,注意力机制

attention注意力机制的理解及简单实现（keras实现版本）

简单理解Transformer注意力机制

深度学习中注意力机制的理解-Attention mechanism

深入理解深度学习——注意力机制（Attention Mechanism）：Bahdanau注意力

注意力机制-CA注意力-Coordinate attention

深入理解深度学习——注意力机制（Attention Mechanism）：自注意力（Self-attention）

深入理解深度学习——注意力机制（Attention Mechanism）：多头注意力（Multi-head Attention）

深入理解深度学习——注意力机制（Attention Mechanism）：注意力评分函数（Attention Scoring Function）

Attention注意力机制–原理与应用

（Slide）Attention Mechanism注意力机制

Attention注意力机制介绍

注意力机制 Attention Model

注意力机制(Attention)学习笔记

Attention注意力机制--原理与应用

Attention注意力机制简介

注意力机制解析--转载Attention

注意力机制(Attention Mechanism)

注意力机制（Attention Mechanism）-CBAM

注意力机制（Attention Mechanism）-ECANet

注意力机制——Coordinate Attention

注意力机制（Attention Mechanism）-SENet

注意力机制之SGE Attention

Attention：何为注意力机制？

ChatGPT 的灵魂：Attention 注意力机制

今日推荐

周排行

Access的四舍五入取整

8.23 前端学习过程

入门学习过程方向与漏洞复现总结：

操作分布式文件之八：如何批量并行读写远程文件和事务补偿处理

应邀出个教程（搭建tensorflow跑网络环境）

Kubernetes之Pod控制器应用进阶

14-[mysql内置功能]--

HDU6212 区间dp 好题

VS2015生成代码图

验证手机号的工具类

每日归档

更多

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)

2024-10-12(0)