去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT - 代码天地

去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT

其他 2021-11-24 13:10:28 阅读次数: 0

作者丨happy
编辑丨极市平台

论文链接：https://arxiv.org/pdf/2110.11945.pdf

代码链接：https://github.com/fudan-zvg/SOFT

项目链接：https://fudan-zvg.github.io/SOFT/

本文是复旦大学&华为诺亚关于Transformer中自注意力机制复杂度的深度思考，首次提出了一种新颖的softmax-free 的Transformer 。本文从softmax self-attention局限性出发，分析了其存在的挑战；然后由此提出了线性复杂度的SOFT；再针对线性SOFT存在的训练问题，提出了一种具有理论保证的近似方案。所提SOFT在ImageNet分类任务上取得了比已有CNN、Transformer更佳的精度-复杂度均衡。

阅读完整原文：去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT：轻松搞定线性近似

猜你喜欢

转载自blog.csdn.net/Extremevision/article/details/121244782

去掉softmax后Transformer会更好吗？复旦&华为诺亚提出SOFT

2022云的世界会更好吗

【NeurIPS 2021】线性复杂度的 Transformer：SOFT: Softmax-free Transformer with Linear Complexity

2024届，找工作会更好吗？

CVPR 2022 | 复旦大学提出ZITS：基于Transformer结构增强的增量式图像修复

ICCV 2023 | 华为诺亚提出全新目标检测器Focus-DETR

YOLOV5/YOLOV8改进：2023 ：华为诺亚提出VanillaNet主干网络

华为和北大等提出视觉Transformer：全面调研

CVPR 2022 | 视频Transformer自监督预训练新范式！复旦&微软提出BEVT：实现视频识别新SOTA...

性能超越最新序列推荐模型，华为诺亚方舟提出记忆增强的图神经网络

与SENet互补提升，华为诺亚提出自注意力新机制：Weight Excitation｜ECCV2020

中科院&华为诺亚提出ViG：一种全新的骨干网络，性能不输CNN、ViT！

CVPR 2022 | 超越Swin！华为诺亚&北大提出Wave-MLP：视觉新主干网络

华为诺亚提出新型Prompting (PHP)，GPT-4拿下最难数学推理数据集新SOTA

[华为诺亚实验室+中科大提出TinySAM | 比SAM小10倍，精度的超车！]

华为提出Sorted LLaMA：SoFT代替SFT，训练多合一大语言模型

365天里有300天都想辞职，换个公司，你的2019会更好吗？

Apache 孵化项目被公然抄袭，开源世界真的会变得更好吗？

学界 | 华为诺亚方舟实验室提出新型元学习法 Meta-SGD ，在回归与分类任务中表现超群

华为诺亚、北大提出GhostNet，使用线性变换生成特征图，准确率超MobileNet v3 | CVPR 2020...

华为外包好吗

softmax，argmax，soft-argmax 理解

【轻量级网络】华为诺亚：VanillaNet

谷歌提出ColTran：Colorization Transformer

去掉 JavaScript 后，亚马逊这些网站会变成这样

YOLOv8最新改进系列：YOLOV8主干改进-华为诺亚提出全新骨干架构VanillaNet，YOLOv8融合深度学习极简主义的力量，大力提升模型鲁棒性！！

YOLOv8/YOLOv7/YOLOv5/YOLOv4/Faster-rcnn系列算法改进【NO.78】引入2023年华为诺亚提出Gold-YOLO模型中Gatherand-Distribute

谷歌提出MaskGIT：掩码生成图像Transformer

华为诺亚实验室VanillaNet学习笔记

Transformer再下一城！low-level多个任务榜首被占领，北大华为等联合提出预训练模型IPT

今日推荐

周排行

AIZU 2224 Save your cats(并查集)

HTTP响应头状态码详解

Python socket编程（2）

MaxCompute Studio使用心得系列7—作业对比

Supervisor安装使用

LeetCode 164. Maximum Gap

mysql面试题: 一张表里面有ID自增主键，当insert了17条记录之后，删除了第15,16,17条记录，再把mysql重启，再insert一条记录，这条记录的ID是18还是15

nutch1.2 DeleteDuplicates IndexMerger 详解

OC - @property与setter,getter方法

SpringBoot @Transactional的rollbackFor属性

每日归档

更多

2024-09-19(0)

2024-09-18(0)

2024-09-17(0)

2024-09-16(0)

2024-09-15(0)

2024-09-14(0)

2024-09-13(0)

2024-09-12(0)

2024-09-11(0)

2024-09-10(0)