更新时间——2019.12 首稿
0. 前言
学习 VQA 的第一步——前期论文调研。 调研近几年在各大会议上的论文发表情况,来了解一下这个方向的进展,主要包括 CVPR, ICCV, ECCV,ACM MM,,AAAI。之后准备总结一下常用的数据集以及经典的方法。
1. ACM MM
ACM MM 是计算机科学与技术多媒体领域的主要国际会议,主要关注不同数字媒体产生的多角度信息整合与处理。而 VQA 隶属于其 多媒体内容理解主题里面(Understanding multimedia content)的 Vision and Language 分支。
1.1 ACM MM 2019
- 不完全统计有 5 篇(包括Video / Visual Question Answer)
1.2 ACM MM 2018
- 不完全统计有 4 篇(包括Video / Visual Question Answer)
1.3 ACM MM 2017
- 不完全统计有 4 篇(包括Video / Visual Question Answer)
论文题目 | 作者单位 |
---|---|
VideoQA via Hierarchical Dual-Level Attention Network Learning | 浙江大学 |
VideoQA via Gradually Refined Attention over Appearance and Motion | 浙江大学 |
2. CVPR
CVPR 全称 Conference on Computer Vision and Pattern Recognition, 中文名为国际计算机视觉与模式识别会议,一般是每年六月左右举行。
2.1 CVPR 2019
- 不完全统计有 12 篇(包括Video / Visual Question Answer),但是基于视频的好像就一篇
2.2 CVPR 2018
- 不完全统计有 15 篇(包括Video / Visual Question Answer),但是基于视频的好像就一篇
2.3 CVPR 2017
- 不完全统计有 9 篇(包括Video / Visual Question Answer),没有基于视频的
3.3 CVPR 2016
- 不完全统计有 8 篇(包括Video / Visual Question Answer),没有基于视频的,而且看起来是刚起步
3. ICCV
ICCV 全称 International Conference on Computer Vision, 中文名为国际计算机视觉大会,每两年在全世界范围内召开一次,录用率比较低,所以在业内评价较高,是三大CV顶会中公认级别最高的。
3.1 ICCV 2019
- 不完全统计有 5 篇(包括Video / Visual Question Answer)
3.2 ICCV 2017
- 不完全统计有 6 篇(包括Video / Visual Question Answer)
3.3 ICCV 2015
- 听名字感觉像是第一篇
论文题目 | 作者单位 |
---|---|
VQA: Visual Question Answering |