MS-CLIP：模式共享的对比语言-图像预训练框架

企业开发 2022-04-04 18:27:55 阅读次数: 0

MS-CLIP: modality-shared contrastive language-image pre-training

论文地址：
主要工作：
主要问题：
基本发现：
实验结果：

论文地址：

ICLR 2022: https://openreview.net/forum?id=ROteIE-4A6W
在这里插入图片描述

主要工作：

现在的大规模多模态模型大都为每种模态使用单独的编码器，但是最近的研究表明，Transformer 可以支持跨多种模式的学习。受此启发，作者研究了如何构建一种模式共享的对比语言-图像预训练框架（MS-CLIP）。

更具体地说，作者在对比预训练中想研究 Transformer 模型的多少参数可以跨模式共享，并严格研究定位沿频谱共享参数比例的

猜你喜欢

转载自blog.csdn.net/weixin_44936889/article/details/120789675

MS-CLIP：模式共享的对比语言-图像预训练框架

CLIP对比语言-图像预训练算法

多模态模型学习1——CLIP对比学习语言-图像预训练模型

clip预训练模型综述

CLIP对比图文预训练（Contrastive Language-Image Pretraining）论文阅读笔记

【跨模态】【对比学习】CLIP：文本监督CV的预训练(2021)

【论文简介】CLIP：图像与自然语言配对预训练可迁移模型：Learning Transferable Visual Models From Natural Language Supervision

18-19基于预训练的语言模型对比

CLIP：语言-图像表示之间的桥梁

论文浅尝 | SimKGC：基于预训练语言模型的简单对比知识图谱补全

预训练语言模型中模型对比与实施结果分析（图文解释）

各种框架的预训练模型

NLP预训练语言模型

预训练语言模型（一）

预训练语言模型综述

Keras预训练模型综合对比

不同预训练模型的总结对比

ICLR 2023 | StrucTexTv2：端到端文档图像理解预训练框架

通用的图像-文本语言表征学习：多模态预训练模型 UNITER

MAE论文精读，预训练图像

NLP文本分类pytorch框架-支持Bert等预训练语言模型

【深度学习】BLIP: 用于统一的视觉-语言理解和生成的引导式语言图像预训练

跨模态检索：基于OpenAI的Clip预训练模型构建以文搜图系统

NLP中的语言模型预训练&微调

NLP中的预训练语言模型（二）

预训练语言模型 | (3) Bert

预训练语言模型 | (2) transformer

预训练语言模型 | (1) 概述

预训练语言模型 | (4) AlBert

ViLBERT：视觉-语言任务预训练模型

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)