ViT Transformer论文阅读笔记

企业开发 2023-09-05 18:11:49 阅读次数: 0

《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》

论文：https://arxiv.org/abs/2010.11929

代码：https://github.com/google-research/vision_transformer

达摩院modelscope模型开源平台快速体验ViT模型: ModelScope 魔搭社区

原理：使用transformer对长序列之间的关系进行建模（自注意力）

方法：首次提出使用transformer进行分类：把输入图像直接划分为token，位置编码为可学习的token，额外增加一个分类token，最后使用head预测。

结果： acc提升， sota

猜你喜欢

转载自blog.csdn.net/tantanweiwei/article/details/128319452

ViT Transformer论文阅读笔记

论文阅读笔记：Vision Transformer (ViT)

论文阅读--视觉Transformer(ViT)

transformer与vit代码阅读

Transformer【ViT】

ViT（Vision Transformer）论文笔记

Vision Transformer 论文 + 详解（ ViT ）

COMO-ViT论文阅读笔记

Vision Transformer（VIT）学习笔记

VIT Adapter【Vision Transformer Adapter for Dense Predictions】论文笔记

Vision Transformer（ViT）

VIT transformer详解

Torch 论文复现：Vision Transformer (ViT)

ViT论文详解

机器学习笔记 - vision transformer（ViT）简述

VIT模型个人笔记

ViT（Vision Transformer）算法入门

Visiom Transformer 代码实现--ViT

Vision Transformer(ViT)及后续工作

Vision Transformer (ViT)及各种变体

Vision Transformer(VIT 网络架构)

Visual Transformer (ViT)模型详解

ViT

ViT【Vision Transformer】论文逐段精读【论文精读】

ViT 论文逐段精读

Next-ViT论文学习笔记

视觉Transformer经典论文——ViT、DeiT的与原理解读与实现

Vision Transformer(ViT)论文解读与代码实践(Pytorch)

课程八学习笔记：卷积和Transformer结合的ViT

WDK_学习笔记_区块链+ViT和Swin transformer

今日推荐

周排行

四大线程池详解

如何高效使用Vim

Mogodb的常用操作总结

Spyder默认页面布局调整

SAR日志分析

OAuth是一个关于授权（authorization）的开放网络标准，在全世界得到广泛应用，目前的版本是2.0版。本文对OAuth 2.0的设计思路和运行流程，做一个简明通俗的解释，主要参考材料为R

WebService中注解开发，CXF，Spring整合，Rest风格

2019考研英语一 Text1分析

windows下安装docker详细步骤

CentOS 7/6系统升级内核版本到5.2.2

每日归档

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)

2024-07-28(0)

2024-07-27(0)