单应矩阵的推导与理解

转载自知乎 [北麓牧羊人] 的文章：https://zhuanlan.zhihu.com/p/138266214)

〇、单应矩阵介绍

单应矩阵 H (Homography)，约束了同一 3D 空间点在两个像素平面的 2D 齐次坐标。

$\mathbf{q}_{b} ∝ \mathbf{H}_{b a} \mathbf{q}_{a} \tag{0.1}\$

展开：

$\left[\begin{array}{c}u_{a} \\ v_{a} \\ 1\end{array}\right] ∝ \left[\begin{array}{lll} H_1 & H_2 & H_3 \\ H_4 & H_5 & H_6 \\ H_7 & H_8 & H_9 \end{array}\right] \left[\begin{array}{c}u_{b} \\ v_{b} \\ 1\end{array}\right] \tag{0.2}\$

正比于符号 $∝\$ 可以理解为单应矩阵 H 约束了 $\mathbf{q}_{b}\$ 和 $\mathbf{H}_{b a} \mathbf{q}_{a}\$ 的方向是同方向，而不约束尺度。可通过叉乘计算消去齐次的尺度因子，因此上面的约束还可以表达为如下形式：

$\mathbf{q}_{b}× \mathbf{H}_{b a} \mathbf{q}_{a} =\mathbf{0} \tag{0.3}\$

因为 $\mathbf{q}_{b}\$ 和 $\mathbf{H}_{b a} \mathbf{q}_{a}\$ 同方向，所以其叉乘结果为 $\bf 0\$ 向量。

依据推导可得，单应矩阵 H 由两相机旋转和平移信息（R,t），两相机内参矩阵 K，平面参数 (n,d) 组成：

$\mathbf{H}_{b a} =\mathbf{K}_{b} \mathbf{R}_{b a} \left( {\bf I}+\frac{1} {d_{a}}·\mathbf{t}_{ab}\mathbf{n}_{a}^{\top} \right) \mathbf{K}_{a}^{-1} \tag{0.4}\$

下面给出上述单应矩阵公式的推导和理解过程。

一、基本设定

1. 相机系坐标

3D 空间点在相机系下的坐标 p 为：

${\bf p}=\left[\begin{array}{l}x \\ y \\ z\end{array}\right] \tag{1.1}\$

2. 像素系坐标

相机系坐标投影到像素系的齐次坐标：

$\mathbf{q} =\left[\begin{array}{l}u \\ v \\ 1\end{array}\right] =\frac{1}{z}·\mathbf{K}{\bf p} \tag{1.2}\$

其中：

q 为像素系齐次坐标；
K 为相机内参矩阵： $\bf K =\left[\begin{array}{ccc}f_{x} & 0 & c_{x} \\ 0 & f_{y} & c_{y} \\ 0 & 0 & 1\end{array}\right]\$ 。

3. 平面参数

3D 空间点 p 所在的平面在相机系下的平面参数为：

$\left\{\mathbf{n}, d\right\} \tag{1.3}\$

其中：

n 为平面法向量；
d 为相机系原点到平面距离。

3D 空间点 p 位于平面 { n,d} 上，由以下方程表达：

$\mathbf{n^{\top}}·{\bf p}+d=0 \tag{1.4}\$

二、平面参数：由像素系计算相机系

1. 由像素系坐标计算相机系坐标：

${\bf p}=z·\mathbf{K}^{-1}\mathbf{q} \tag{2.1}\$

由于存在未知的深度 z ，因此无法由像素系计算出相机系坐标。

2. 平面参数计算深度

结合(1.4)(2.1)得：

$z·\mathbf{n}^{\top} \mathbf{K}^{-1} \mathbf{q}+d=0 \tag{2.3}\$

整理得：

$z=-\frac{d} {\mathbf{n}^{\top} \mathbf{K}^{-1} \mathbf{q}} \tag{2.4}\$

可见：通过 3D 点所在平面参数和像素系坐标 q 可以计算出 3D 点的深度 z 。

结合(2.1)(2.4)得：

${\bf p}=-\frac{d}{\mathbf{n}^{\top} \mathbf{K}^{-1} \mathbf{q}}· \mathbf{K}^{-1} \mathbf{q} \tag{2.5}\$

可知，加入平面信息 { n,d } 后，可完全由像素坐标还原出相机系坐标。

三、单应矩阵：由像素系 a 计算像素系 b

1. 由 a 系像素计算 b 系像素

有相机系 a 下的点 ${\bf p}_a\$ 和相机系 b 下的点 ${\bf p}_b\$ ：

$\left[\begin{array}{c} {\bf p}_{b} \\ 1\end{array}\right] = \underbrace{ \left[\begin{array}{cc} \mathbf{R}_{b a} & \mathbf{t}_{ba} \\ \mathbf{0}^{} & 1 \end{array}\right]}_{\mathbf{T}_{b a}} \left[\begin{array}{c} {\bf p}_{a} \\ 1\end{array}\right] \tag{3.1}\$ ${\bf p}_b=\mathbf{R}_{b a} {\bf p}_{a}+\mathbf{t}_{ba} \tag{3.2}\$

其中：

${\bf R}_{ba}\$ 表示：1. b 系下 a 系的姿态。2. a 系到 b 系的坐标旋转变换；
${\bf t}_{ba}\$ 表示：1. b 系下 a 系的位置。2. a 系到 b 系的坐标平移变换。

转到对应像素系，有关系：

$z_{b}·\mathbf{K}_{b}^{-1} \mathbf{q}_{b} =z_{a}·\mathbf{R}_{ba} \mathbf{K}_{a}^{-1} \mathbf{q}_{a}+\mathbf{t}_{ba} \tag{3.3}\$

可得到，由 a 系像素表达的 b 系像素：

$\mathbf{q}_{b} =\frac{z_{a}}{z_{b}}·\mathbf{K}_{b} \mathbf{R}_{b a} \mathbf{K}_{a}^{-1} \mathbf{q}_{a} +\frac{1}{z_{b}} ·\mathbf{K}_{b} \mathbf{t}_{ba} \tag{3.4}\$

但是存在未知数 $z_a,z_b\$ ，所以无法直接通过 a 系像素得到 b 系像素。

2. 加入平面参数

结合(2.4)(3.4)

$\begin{align*} \mathbf{q}_{b} &=\frac{z_{a}}{z_{b}} · \mathbf{K}_{b} \mathbf{R}_{b a} \mathbf{K}_{a}^{-1} \mathbf{q}_{a} +\frac{1}{z_{b}}· \mathbf{K}_{b} \mathbf{t}_{ba} \\ &=\frac{z_{a}}{z_{b}} ·\mathbf{K}_{b} \left( \mathbf{R}_{b a} \mathbf{K}_{a}^{-1} \mathbf{q}_{a} + \frac{\mathbf{t}_{b a}}{z_{a}} \right) \\ &=\frac{z_{a}}{z_{b}}·\mathbf{K}_{b} \left( \mathbf{R}_{b a} \mathbf{K}_{a}^{-1} \mathbf{q}_{a} -\frac{\mathbf{t}_{b a}\mathbf{n}_{a}^{\top} \mathbf{K}_{a}^{-1} \mathbf{q}_{a}} {d_{a}} \right) \\ &=\frac{z_{a}}{z_{b}}·\mathbf{K}_{b} \left( \mathbf{R}_{b a} -\frac{\mathbf{t}_{b a}\mathbf{n}_{a}^{\top}} {d_{a}} \right) \mathbf{K}_{a}^{-1} \mathbf{q}_{a}\\ &=\frac{z_{a}}{z_{b}}·\mathbf{K}_{b} \left( \mathbf{R}_{b a} + \mathbf{R}_{b a}\mathbf{t}_{ab} \frac{\mathbf{n}_{a}^{\top}} {d_{a}} \right) \mathbf{K}_{a}^{-1} \mathbf{q}_{a}\\ &=\frac{z_{a}}{z_{b}} ·\mathbf{K}_{b} \mathbf{R}_{b a} \left( {\bf I}+\frac{1} {d_{a}}·\mathbf{t}_{ab}\mathbf{n}_{a}^{\top} \right) \mathbf{K}_{a}^{-1} \mathbf{q}_{a}\\ &=\mathbf{K}_{b} \mathbf{R}_{b a} \left( {\bf I}+\frac{1} {d_{a}}·\mathbf{t}_{ab}\mathbf{n}_{a}^{\top} \right) \mathbf{K}_{a}^{-1} \mathbf{q}_{a}\\ \end{align*} \tag{3.5}\$

上面推导用到的理论：

${\bf R}_{ba}{\bf t}_{ab}=-{\bf t}_{ba}\$
齐次坐标与系数无关，因此可省去 $\frac{z_a}{z_b}\$

可见，加入 3D 点的平面参数后，可由 a 系下像素坐标完全计算出对应的 b 系下像素坐标。

3. 定义单应矩阵

符号简化：

$\mathbf{q}_{b}=\mathbf{H}_{b a} \mathbf{q}_{a} \tag{3.6}\$

其中 $\mathbf{H}_{b a}\$ 为由像素系 a 到像素系 b 的 单应矩阵：

$\mathbf{H}_{b a} =\mathbf{K}_{b} \mathbf{R}_{b a} \left( {\bf I}+\frac{1} {d_{a}}·\mathbf{t}_{ab}\mathbf{n}_{a}^{\top} \right) \mathbf{K}_{a}^{-1} \tag{3.7}\$

单应矩阵包含了相机内参矩阵 $\mathbf{K}_{a},\mathbf{K}_{b}\$ 、旋转 $\mathbf{R}_{b a}\$ 、平移 $\mathbf{t}_{ab}\$ 和平面参数 $\{\mathbf{n}_a,d_a\}\$ 信息。引入单应矩阵后，可以直接通过 a 系像素得到 b 系像素。

四、求解单应矩阵

(3.7)给出的单应矩阵的定义是通过旋转平移信息计算的，现实中有时不知道旋转平移信息，而知道两张图像中的匹配点，可以由匹配点计算出单应矩阵。

对于图片上的一对匹配点有如下关系：

$q_2∝\mathbf{H}q_1 \tag{4.1}\$

展开得：

$\begin{align*} \left(\begin{array}{c}u_{2} \\ v_{2} \\ 1\end{array}\right) ∝ \left(\begin{array}{lll} \mathbf{H}_{11} & \mathbf{H}_{12} & \mathbf{H}_{13} \\ \mathbf{H}_{21} & \mathbf{H}_{22} & \mathbf{H}_{23} \\ \mathbf{H}_{31} & \mathbf{H}_{32} & \mathbf{H}_{33} \end{array}\right)\left(\begin{array}{c}u_{1} \\ v_{1} \\ 1\end{array}\right) \end{align*} \tag{4.2}\$

1. 单应矩阵有 8 个未知数

因为转换的是齐次坐标，所以单应矩阵 H 与尺度无关，也即 aH 与 H 的作用是相同的，因此自由度为 8，使用 $\mathbf{H}_{33}=1\$ 来进行归一化。

$\left( \begin{array}{c}u_{2} \\ v_{2} \\ 1\end{array}\right) ∝ \left(\begin{array}{lll}H_{11} & H_{12} & H_{13} \\ H_{21} & H_{22} & H_{23} \\ H_{31} & H_{32} & 1\end{array}\right)\left(\begin{array}{c}u_{1} \\ v_{1} \\ 1 \end{array}\right) \tag{4.3}\$

故 H 共 8 个未知数，需要 8 个方程来解。

2. 一对匹配点提供 2 个方程

由于是齐次坐标，所以展开是这种形式：

$\left\{\begin{aligned} u_{2} &= \frac{H_{11} u_{1}+H_{12} v_{1}+H_{13}}{H_{31} u_{1}+H_{32} v_{1}+1} \\ v_{2} &= \frac{H_{21} u_{1}+H_{22} v_{1}+H_{23}}{H_{31} u_{1}+H_{32} v_{1}+1} \end{aligned}\right. \tag{4.4}\$

3. 四对匹配点提供 8 个方程

$\left(\begin{array}{cccccccc}u_{1}^{1} & v_{1}^{1} & 1 & 0 & 0 & 0 & -u_{1}^{1} u_{2}^{1} & -v_{1}^{1} u_{2}^{1} \\ 0 & 0 & 0 & u_{1}^{1} & v_{1}^{1} & 1 & -u_{1}^{1} v_{2}^{1} & -v_{1}^{1} v_{2}^{1} \\ u_{1}^{2} & v_{1}^{2} & 1 & 0 & 0 & 0 & -u_{1}^{2} u_{2}^{2} & -v_{1}^{2} u_{2}^{2} \\ 0 & 0 & 0 & u_{1}^{2} & v_{1}^{2} & 1 & -u_{1}^{2} v_{2}^{2} & -v_{1}^{2} v_{2}^{2} \\ u_{1}^{3} & v_{1}^{3} & 1 & 0 & 0 & 0 & -u_{1}^{3} u_{2}^{3} & -v_{1}^{3} u_{2}^{3} \\ 0 & 0 & 0 & u_{1}^{3} & v_{1}^{3} & 1 & -u_{1}^{3} v_{2}^{3} & -v_{1}^{3} v_{2}^{3} \\ u_{1}^{4} & v_{1}^{4} & 1 & 0 & 0 & 0 & -u_{1}^{4} u_{2}^{4} & -v_{1}^{4} u_{2}^{4} \\ 0 & 0 & 0 & u_{1}^{4} & v_{1}^{4} & 1 & -u_{1}^{4} v_{2}^{4} & -v_{1}^{4} v_{2}^{4}\end{array}\right) \left(\begin{array}{l}H_{11} \\ H_{12} \\ H_{13} \\ H_{21} \\ H_{22} \\ H_{23} \\ H_{31} \\ H_{32}\end{array}\right) = \left(\begin{array}{c}u_{2}^{1} \\ v_{2}^{1} \\ u_{2}^{2} \\ v_{2}^{2} \\ u_{2}^{3} \\ v_{2}^{3} \\ u_{2}^{4} \\ v_{2}^{4}\end{array}\right) \tag{4.5}\$

解此线性方程组，可得单应矩阵 H。