假设已经可以获取人体关键点的坐标,那么如何把视频的连续帧完整考虑,整合为一个工程落地的应用,比如俯卧撑计数器呢?这就要设计到特征工程及分类器的构建了。下面会一一分析。
我们先由简到难的考虑一个问题:如果要检测用手托住下巴这个简单动作。则可以把手的关键点和下巴关键点算一个欧氏距离,如果这个距离小于某个阈值就判断动作实现。这是非常容易的。
那么如果要俯卧撑这样的复杂动作,则需要对关键点进行特征工程,具体的做法如下图:
假设已经可以获取人体关键点的坐标,那么如何把视频的连续帧完整考虑,整合为一个工程落地的应用,比如俯卧撑计数器呢?这就要设计到特征工程及分类器的构建了。下面会一一分析。
我们先由简到难的考虑一个问题:如果要检测用手托住下巴这个简单动作。则可以把手的关键点和下巴关键点算一个欧氏距离,如果这个距离小于某个阈值就判断动作实现。这是非常容易的。
那么如果要俯卧撑这样的复杂动作,则需要对关键点进行特征工程,具体的做法如下图: