【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP - 代码天地

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

业界资讯 2023-04-16 12:35:21 阅读次数: 0

来源：专知
本文为论文介绍，建议阅读5分钟本文提出一种多模态提示学习方案，在单一统一训练下平衡有监督和零样本的性能。

将CLIP等对比图像-文本预训练模型用于视频分类，因其成本效益和具有竞争力的性能而受到关注。然而，最近在这一领域的工作面临一个权衡。对预训练模型进行微调以实现强监督性能，会导致低零样本泛化。类似地，冻结主干以保留零样本能力会导致监督精度的显著下降。因此，最近的文献工作通常为监督和零样本行为识别训练单独的模型。本文提出一种多模态提示学习方案，在单一统一训练下平衡有监督和零样本的性能。视觉方面的提示方法满足了三个方面的需求:1)全局视频级提示对数据分布进行建模;2)局部帧级提示，为每帧提供判别式条件;以及3)用于提取浓缩视频表示的摘要提示。此外，在文本端定义了一个提示方案，以增强文本上下文。通过这种激励方案，可以在Kinetics-600、HMDB51和UCF101上实现最先进的零样本性能，同时在有监督的环境中保持竞争力。通过保持预训练主干冻结，优化了更少的参数数量，并保留了现有的通用表示，这有助于实现强大的零样本性能。我们的代码/模型发布在https://github.com/TalalWasim/Vita-CLIP.

猜你喜欢

转载自blog.csdn.net/tMb8Z9Vdm66wH68VX1/article/details/130143261

【CVPR2023】Vita-CLIP:通过多模态提示的视频和文本自适应CLIP

CVPR 2023 | 白翔团队提出：将CLIP模型用于场景文本检测

视频文本检索之CLIP4Clip

【多模态】CLIP模型

Clip

CVPR2023

CLIP多模态代码试玩

CLIP：连接文本-图像

SadTalker（CVPR2023）-音频驱动视频生成

【CVPR2023】具有全局上下文增强的自适应稀疏卷积网络，用于加快无人机图像的目标检测...

CVPR 2023 | AdaAD: 通过自适应对抗蒸馏提高轻量级模型的鲁棒性

【多模态】23、RO-ViT | 基于 Transformer 的开发词汇目标检测（CVPR2023）

【多模态】22、UniDetector | 检测开放世界中的一切！（CVPR2023）

视频领域 CLIP4clip：An Empirical Study of CLIP for End to End Video Clip Retrieval

CLIP在视频领域的应用（CLIPBERT，CLIP4Clip，CLIP2Video，CLIPTV）

CVPR‘2023 | Cross-modal Adaptation: 基于 CLIP 的微调新范式

StyleGAN-NADA：CLIP引导的非对抗域自适应（Domain Adaptation）图像生成器

【跨模态】【对比学习】CLIP：文本监督CV的预训练(2021)

【论文速递】CVPR 2020 - CLIP-Event：用事件结构连接文本和图像

CLIP：训练一个图像和文本的统一向量嵌入

【多模态】26、视觉-文本多模态任务超详细介绍「CLIP/LSeg/ViLD/GLIP/ALBEF/BLIP/CoCa/BEIT」

CLIP系列：CLIP：沟通文本和图像的桥梁

CVPR2023最新论文 (含语义分割、扩散模型、多模态、预训练、MAE等方向)

CVPR2023 | MSMDFusion: 激光雷达-相机融合的3D多模态检测新思路（Nuscenes SOTA！）...

【数字人】1、SadTalker | 使用语音驱动单张图片合成视频（CVPR2023）

CVPR2023论文及代码合集来啦~

CVPR2023 目标检测论文合集

CVPR2023 语义分割论文合集

FasterNet（PConv）paper笔记（CVPR2023）

图像文本检索之clip

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)