一篇视频时序检测的老算法：R-C3D（一图读算法） - 代码天地

一篇视频时序检测的老算法：R-C3D（一图读算法）

其他 2021-03-20 21:05:59 阅读次数: 0

最近翻了一篇老论文R-C3D: Region Convolutional 3D Network for Temporal Activity Detection，该文使用3D卷积+temporal proposal进行时序检测，算法思路简单明了，直接上图：

该算法思路可理解为，将双阶段的目标空间检测向时序维度检测的扩展，因为输入添加了时间维度，故使用了3D卷积，经过backbone前向，将原本L帧的视频信息采样至L/8帧，对L/8的每一帧预测K个temporal anchor proposals，每个proposal包括一个是否包含动作的二分类分数以及时间补偿（中心的偏移量，以及长度的偏移量），通过NMS处理后，经过3D roi Pooling统一尺度，进行第二阶段的种类预测以及精准时间补偿预测。

猜你喜欢

转载自blog.csdn.net/dl643053/article/details/107150726

一篇视频时序检测的老算法：R-C3D（一图读算法）

R-C3D 视频活动检测的经典算法

视频行为识别检测综述 IDT TSN CNN-LSTM C3D CDC R-C3D

pytorch版本的R-C3D工作以及扩展

R-C3D: Region Convolutional 3D Network for Temporal Activity Detection

Markdown如何画时序图，一篇就够了

读这一篇学习推荐引擎的原理与算法

R_3D图(一)

一篇打尽回文算法

一篇文章讲述算法

一篇让你读懂diff算法

Context R-CNN一种基于注意力机制的视频检测算法

第一篇：关键点检测算法基础及mmpose文件夹规则

Verilog：【7】超详细WaveDrom教程，时序图绘制利器，看这一篇就够了。

如何读一篇论文，笔记

【转】如何读一篇论文

Maven读这一篇就够了

3D模型的渲染，这一篇就够了

目标检测算法（一）：R-CNN详解

目标检测算法（一）——R-CNN

一篇解双链表（0基础看）（C语言）《数据结构与算法》

R-CNN 一篇就够了

重温算法第一篇：冒泡排序

转载一篇关于HMM的算法，通俗易懂

开博第一篇--对几个算法的学习

【面试必读（编程基础）】转一篇言简意赅的a*算法

ROB 第一篇 DFS & BFS （寻迹算法）

一篇文章搞懂算法基础

第一篇：数据结构与算法

算法与数据结构入门一篇就搞定

今日推荐

周排行

深度学习------Lingvo框架下的加速通道GPipe

webjars管理静态资源

C专家编程_2.2

mysql 源码安装

json文件操作

123231432

注解的实现

Spring MVC 控制器

《人月神话》读后感二

C#使用HttpWebRequest和HttpWebResponse上传文件示例

每日归档

更多

2024-09-08(0)

2024-09-07(0)

2024-09-06(0)

2024-09-05(0)

2024-09-04(0)

2024-09-03(0)

2024-09-02(0)

2024-09-01(0)

2024-08-31(0)

2024-08-30(0)