[INSTANT NOTE]视频流编码基础及后置隐写基础

视频编码基础

视频是一系列图像基于时间的集合.
相邻帧差异一般情况下较小.
为了最大限度压缩,一般采用偏差的编码思想.
$P_1\\P_2=P_1+offset_2\\P_3=P_1+offset_3$
此处P1称作基准帧或参照帧.

帧间压缩

在这里插入图片描述
每一个帧组的帧具有较强的联系关系,
每个帧组的第一帧为整个帧组的基准帧.
一般两个帧组之间的差异较大.
基准帧称为I帧
P帧为仅仅参考I帧的帧.
B帧为参考前后两帧的帧.
解码顺序为I-P-B.

运动估计

一个块在两帧之间移动了一个相对量,记录这个相对量可以避免重新编码占用空间.
通过遍历查找相似块,可以得出这个偏移向量.
在这里插入图片描述
上图的 $(-2,2)$ 就是要找的偏移向量.

帧内预测

帧内的内容也可能有强相关性,尤其是相邻的内容.帧内压缩目标是对单个帧(I)尽可能的压缩.
在这里插入图片描述
对于一个块.预测所需的信息是这些相邻块的字.

在这里插入图片描述
几种预测模式.根据预测模式的不同会对隐写的位置的选择产生影响.

16*16的预测模式.
一般来说,内容变化越不剧烈的地方使用的块越大.如下图,

HEVC/H.265标准提供了更多样的块尺寸选择.最多能到64*64.

基于帧内预测的隐写选择

误差矩阵

指套用在某一块上的隐写造成的隐写后视频和原视频块相比造成的误差.
$\Delta=\left[ \begin{matrix}0&0&0&0\\t&0&0&0\\0&0&0&0\\0&0&0&0\end{matrix} \right]$
在4*4块的某一处嵌入数值 $t$ .误差矩阵如下.
在这里插入图片描述

帧内漂移

基于上面提到的帧内预测模式,某一块的内容改变会造成预测路径上一系列的块的内容改变,从而造成大规模的失真.隐写之前必须考虑这一点并尽可能消除影响.
解决问题的关键是阻断误差的传播路径,即关键像素.
对某一块数据,相邻块用到的数据称为关键像素.也就是右侧和下方.
在这里插入图片描述

误差补偿

(推导略)对于一个4*4像素矩阵,在某个地方嵌入误差 $t$ ,则在另一个恰当的地方嵌入 $-kt$ 可以使得误差矩阵的边缘行或列为0,从而阻断误差的传播.这样的位置对 $(C_1,kC_2)$ 称为耦合数对.

数对设置规则

如果要让行为0,则 $C_1,C_2$ 在同一行.列也是这样.
以使得行为0为例,如果 $C_1$ 在第一列,则 $C_2$ 在第三列,补偿系数 $k=1$ ;
如果 $C_1$ 在第二列,则 $C_2$ 在第四列,补偿系数 $k=2$ ;
Sample:
$\Delta=\left[ \begin{matrix}0&0&0&0\\t&0&-t&0\\0&0&0&0\\0&0&0&0\end{matrix} \right]\tag{1}$
$E=\left[ \begin{matrix}0&0&0&0\\..&..&..&..\\..&..&..&..\\0&0&0&0\end{matrix} \right]\tag{1'}$
$\Delta=\left[ \begin{matrix}0&0&0&0\\0&t&0&-2t\\0&0&0&0\\0&0&0&0\end{matrix} \right]\tag{2}$
$E=\left[ \begin{matrix}0&0&0&0\\..&..&..&..\\..&..&..&..\\0&0&0&0\end{matrix} \right]\tag{2'}$