视频理解1-two-stream - 代码天地

视频理解1-two-stream

企业开发 2023-10-06 01:17:31 阅读次数: 0

视频理解

视频分类，也叫做动作识别，或者视频理解。因此对人的动作感兴趣。

概述

单个cnn仅适合学习局部信息，不适合学习移动信息。

因此，学习光流到动作的映射。

时间流网络：一系列的光流。

1. 光流

观察者和场景中各种物体的运动。描述视频中各个物体时如何运动的。

背景没有动。越亮的地方，运动越厉害。

光流是非常有效的表示物体之间运动的特征。

光流可以忽略性别，穿着等，仅仅关注与动作本身。

3. 摘要

3.1 需要同时获取两种信息：

（1）静止图像的外观信息：形状，大小，颜色，场景等；

（2）物体的运动信息，或者视频的时序信息。

3.2 三个贡献

（1）双流网络-空间流 + 时间流；

（2）少量数据上，即使只用光流信息，也可以获得不错的结果。

（3）多任务学习，2个数据集，同时学习backbone。

4. 引言

（1）视频自带数据增强功能；

（2）视频帧直接丢i给网络。很差

（3）手工特征，在光流轨迹上提取特征，很好的抓取运动信息。空间流，采用预训练网络。

(4) 将一个视频扔给一个2D网络，和将一系列视频丢给一个3D网路，很相似，学不到时空信息。

5. 双流网络的结构

空间流：获取外观信息；

时间流：获取运动信息；

最后，合并信息，采用加权平均/svm分类。

5.1 空间流

采用静止的信息，图像学习关联物体，本来就不错了。并且可以做预训练。

5.2 时间流

每个像素点，都会运动，如果不运动，光流幅度就会为0.

每两张图像，得到一张光流。

5.2.2.如何使用光流

如果将光流图，拆解出来，则意义不大了。学不到时序信息。

因此，光流网络是输入多个光流的。

5.2.3.如何叠加光流

光流已经经过resize了

左边：基于固定坐标的方式搜索；右边：基于移动坐标的方式搜索（基于轨迹的方式）。

实验结果：左边的方式，比右边要好一些。

双向光流：前半段做前向光流，后半段做后向光流。此时的光流输入为2L。

光流怎么叠加：

此光流送入时间流网络。

上面输入维度为3，下面输入维度为2L。

11帧。

叠加方式:先叠加水平的光流，后竖直的光流。

5.2.4 实现细节

测试：等间距抽帧

光流：先取25帧，然后往后连续取11帧，获取光流，然后光流送入时间流网络。

最后将所有的结果，取平均。

空间流和时间流，分别各自取平均，然后做late fusion，加一起除以2。此为最终的双流网络的结果。

抽取光流：很耗时，密集表示，存储空间大。

6.实验结果

光流时序越长，效果越好。

简单的堆叠更好

双向光流更好。

论文音声

猜你喜欢

转载自blog.csdn.net/gaotihong/article/details/124989843

视频理解1-two-stream

【论文视频】双流网络论文逐段精读. Two-Stream Convolutional Networks for Action Recognition in Videos. 2014【视频理解】

java8 stream理解与应用（1）

视频分类论文“Towards Good Practices for Very Deep Two-Stream ConvNets”程序运行过程

视频动作识别--Two-Stream Convolutional Networks for Action Recognition in Videos

【视频行为识别5】(双流网络)Two-stream Convolution Networks for Action Recognition in Videos(2014)

Two-stream双流总结

【视频行为识别4】I3D：Two-Stream Inflated 3D ConvNets —CVPR2017

Stream的使用与理解

如何理解流Stream

Stream概念的理解

Stream中的Pipeline理解

理解Unix Stream Socket

mjpg-stream 视频服务（1）| 简介与配置树莓派使用

LeetCode 1 two Sum

1. Two Sum

1.Two Sum

leetcode 1：two sum

LeetCode 1 - Two Sum

Leetcode #1 Two Sum

1-Two Sum

leetcode（1）------Two Sum

LeetCode[1]Two Sum

Leetcode 1: Two Sum

LeetCode(1)--Two sum

[Leetcode]#1 Two Sum

1、Two Sum

LeetCode 1——Two Sum

Leedcode 1 Two sum

Two Sum[LeetCode 1]

今日推荐

周排行

成为C++高手之宏与枚举

在CAD二次开发中使用进度条

Js插件ECharts，HighCharts学习网址整理

Celery提交任务出错(on windows.)

cephfs内核客户端性能追踪

thinkphp中PHPExcel用法

EntityFramework动态组合多排序字段

汇编语言（八）实验9 根据材料编程

安装ubuntu后必须做的事情（对我而言）

JS函数式编程

每日归档

更多

2024-10-22(0)

2024-10-21(0)

2024-10-20(0)

2024-10-19(0)

2024-10-18(0)

2024-10-17(0)

2024-10-16(0)

2024-10-15(0)

2024-10-14(0)

2024-10-13(0)