普适性的视觉感知与运动感知

转自:http://www.toutiao.com/i6456928733306552846/


一、什么是普适性视觉

视觉感知的内涵:对每一帧3D视频,直接地能够分析清楚帧内都有什么、在什么位置、姿态是什么,间接地了解帧内各物体的相互关系;对帧间3D视频序列,直接地能够分析帧间相同物体的运动情况,这里的运动包含非刚体&非线性运动,间接地了解各物体的相互运动影响。

从这样的内涵出发,针对普适性的视觉目标,有两点需要做到:

  1. 稳定地、无歧义地、同胚地对场景&物体的覆盖性视觉表达——普适性视觉;

  2. 普适性视觉基础上的精确配准。

先看我们的算法,如下图,对每一帧3D视频,做出普适性视觉表达,帧间对物体的各局部的非刚体非线性运动,都能很好的捕捉(所使用的数据集均是行业公开的代表性数据)。

普适性的视觉感知与运动感知

普适性视觉感知&运动感知

我们的视觉算法与当前相关算法的对比,如下图:

普适性的视觉感知与运动感知

相关算法的对比效果

注:对比性的相关算法,需要详细了解,可以网络搜索查看。

二、视觉感知与运动感知的应用

视觉技术的应用比较广泛,典型应用如下:

  • 智能电视上的手势操控

  • 体感游戏

  • AR眼镜

  • AR游戏

  • (语义)SLAM

  • 机器人跟踪

  • 高精地图

  • 视觉导航


猜你喜欢

转载自blog.csdn.net/hjwang1/article/details/77528361