即时通讯音视频开发（四）：视频编解码之预测技术介绍 - 代码天地

即时通讯音视频开发（四）：视频编解码之预测技术介绍

其他 2018-11-14 02:24:27 阅读次数: 0

前言

即时通讯应用中的实时音视频技术，几乎是IM开发中的最后一道高墙。原因在于：实时音视频技术 = 音视频处理技术 + 网络传输技术的横向技术应用集合体，而公共互联网不是为了实时通信设计的。

系列文章

1. 预测技术的作用

目的是去除空间冗余和时间冗余。因为视频存在大量的空间冗余和时间冗余，包括空间冗余、时间冗余，预测后得到去除大部分空间或时间冗余的残差。

2. 空间冗余

图像空间相邻像素具有很强的相关性，帧内预测技术去除空间冗余。

104906jo7xhmli7ou77207.png (576Ã272)

3. 亮度预测模式

104951qaabbaz222sv2bby.png (576Ã284)

104952ekkkau4iagu4n5gy.png (548Ã596)

104952vxwxwan4sf5jwdz7.png (576Ã375)

4. 色度预测模式

105041fzymtigmmcotx4ta.png (576Ã363)

105041rjrrf1abkxcvvvd0.png (576Ã360)

5. 时间冗余

视频图像在时间上有较强的相关性，即存在时间冗余。去除时间冗余的编码技术有：运动估计（Motion Estimation，ME）、运动补偿（Motion Compensation，MC）。

105407swrb8bienmecnrr8.png (562Ã477)

6. 运动模型

105501icz1tc4p1zapxaxk.png (576Ã270)

105537jpei6bwdd6bdz66d.png (576Ã356)

105543ka5a6z6xkz53x9kx.png (576Ã488)

7. 匹配准则

105644w7yhkq3oy7qol66k.png (576Ã257)

8. 运动估计

目的是去除视频图像的时间冗余。运动估计在搜索范围内为当前块寻找匹配最好的预测块，全搜索方式的运动估计计算复杂度高。

105746kufbzh1nuaa4gzvv.png (455Ã467)

9. 快速运动估计算法种类

在保持预测精度的同时减少运动估计的搜索次数，典型算法有：

三步搜索（Three Step Search，TSS）
二维Log搜索（2D Logarithmic Search，2DLOG）
正交搜索（Orthogonal Search Algorithm，OSA）
十字搜索（Cross Search Algorithm，CSA）
新三步搜索（New Three Step Search，NTSS）
四步搜索（Four Step Search，FSS）
共轭方向搜索（Conjugate Direction Search，CDS）
梯度下降搜索（Gradient Descent Search，GDS）
层次块搜索（Hierarchical Block Matching Algorithm，HBMA）

10. 搜索算法复杂度比较

110000x0nvvcin881t8j7v.png (576Ã305)

11. 分像素运动估计与运动补偿

时域运动位置更可能在整象素之间，即分像素上。利用相邻的整象素可以估计出分象素的值：常用线性或双线性插值得到分象素的值。分象素运动估计有更高的预测精度，但复杂度也更高：1/2分象素运动估计，图像存储空间增加4倍，运动矢量需要放大2倍，1/4分象素运动估计，图像存储空间增加16倍，运动矢量需要放大4倍，计算复杂度也成倍增加。

110127ihmhho2ykbmmko6c.png (576Ã358)

12. 分像素插值

110158uuz5cifzbkec1zef.png (576Ã227)

13. 多参考帧预测

有更多的候选图像，搜索更精确的预测块。

110249tvaq42d06f6kqnkl.png (576Ã236)

14. 图像分块编码

110335qqi33r5z93nn09vw.png (576Ã412)

110347pc88nn3c64ynynf5.png (576Ã425)

视频内容的运动非常复杂，图像分块编码可以更好的提高运动预测精度，提高压缩效率。要在编码块大小和附信息（MV，Mode）编码比特数之间权衡，小的编码块大小会有更好的预测但有更多的附信息比特数。

110436hoxj1xxkksssxjzr.png (576Ã188)

15. 双向预测编码

110509mva9v7eiae03qzk7.png (576Ã386)

16. B帧有更好的编码效率

新出现的对象参考将来的帧有更好的预测效果，前后两个预测的平均值可以减少预测方差。

110630nw57ssz37w904a0e.png (576Ã276)

17. 全局运动估计

基于全局仿射运动模型。预测精度不如基于块的运动估计。MV数目少，适合简单运动场景的运动估计。

110713phese8u8877l8zn5.png (576Ã264)

网易云信，你身边的即时通讯和音视频技术专家，了解我们，请戳网易云信官网

想要阅读更多行业洞察和技术干货，请关注网易云信博客

本文转载自52im,作者：JackJiang

猜你喜欢

转载自blog.csdn.net/netease_im/article/details/83758134

即时通讯音视频开发（四）：视频编解码之预测技术介绍

即时通讯音视频开发视频编解码预测技术

即时通讯音视频开发（二）：视频编解码之数字视频介绍

即时通讯音视频开发（三）：视频编解码之编码基础

即时通讯音视频开发（六）：如何开始音频编解码技术的学习

即时通讯音视频开发之音频编解码技术的学习

即时通讯音视频开发（一）：视频编解码之理论概述

iOS学习-即时通讯音视频(一)之视频编解码之理论

iOS学习-即时通讯音视频(二)之视频编解码基础

即时通讯音视频开发数字视频介绍

音视频开发入门基础及视频会议即时通讯开源技术选择

即时通讯音视频开发（十）：实时语音通讯的回音消除技术详解

即时通讯音视频开发（十）：实时语音通讯的回音消除技术详解

即时通讯音视频开发（十四）：实时音视频数据传输协议介绍

音视频即时通讯开发中使用P2P技术的好处

im即时通讯开发：实时音视频直播的关键技术指标

即时通讯开发时移动端实时音视频直播技术之处理

即时通讯音视频开发之移动端开发的几个建议

即时通讯音视频开发（五）：认识主流视频编码技术H.264

即时通讯音视频开发（十一）：实时语音通讯丢包补偿技术详解

音视频即时通讯应用

即时通讯音视频开发（九）：实时语音通讯的回音及回音消除概述

即时通讯音视频开发（八）：常见的实时语音通讯编码标准

即时通讯音视频开发（九）：实时语音通讯的回音及回音消除概述

即时通讯音视频开发（十六）：移动端实时音视频开发的几个建议

即时通讯开发实现延迟低于500毫秒的实时音视频技术

SignalR+WebRTC技术实现音视频即时通讯功能

即时通讯音视频开发（十二）：多人实时音视频聊天架构探讨

浅析即时通讯音视频开发多人实时音视频聊天架构

即时通讯开发之优化传输机制实现实时音视频的超低延迟

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)