矩阵知识：线性变换、相似矩阵、对角矩阵、逆矩阵

一、线性变换

1.1 什么是线性变换

首先给出一个比较抽象的解释方式：
$对于一个变换A，找两个向量，如果这个变换满足可加性与齐次性：$
$A(\alpha+\beta)=A\alpha+A\beta$
$A(k\alpha)=k(A\alpha)$
$那么这个变换就是线性变换$

1.2 从函数角度理解

1.2.1 首先复习下函数

函数客观的讲就是把x轴上的点映射到曲线上，以下是一个正弦函数：
在这里插入图片描述

1.2.2 线性函数

有的函数，比如y=x，是把x轴上的点映射到直线上，这种称之为线性函数：
在这里插入图片描述

1.3 从线性函数到线性变换

线性函数其实就是线性变换，为了看起来更像线性变换，这里换一种标记方法：

之前的y=x，可以认为是把 $(a,0)$ 映射到了 $(0,a)$ 点，这被称为线性变换T，记作：
在这里插入图片描述
矩阵的形式如下：

这里将 $(a,0)$ 替换为平面内所有的点 $(a,b)$ ，我们就可以对整个平面做变换，该线性变换记作：

写成矩阵的形式：

我们记：

这时可以得到一个更简便的记法（这种形式看起来更像线性方程 $y=ax$ ）：
在这里插入图片描述
我们已经假定 $\overrightarrow{y},\overrightarrow{x}$ 指代了平面上所有的点，所以干脆可以更简化为：

线性变换通过矩阵A来表示

而y=x不过是这个A的一个特殊情况

1.4 矩阵A与基

刚才的结论其实是不完整的，还缺少了一个信息：
y=x是基于直角坐标系的，通过这个转换：
在这里插入图片描述
得到的A也是基于直角坐标系的。
只是在线性变换中，我们不称之为直角坐标系，而是叫做标准正交基。
标准正交基是：

它们张成的线性空间如下：

在这里插入图片描述
这里，对前面的结论进行一个补充：

线性变换通过指定基下的矩阵A来表示

注意这个”指定基“，这说明基不一定固定为正交基，由此引出相似矩阵的概念。

二、相似矩阵

2.1 定义：

设 $A,B$ 都是n阶矩阵，若有n阶可逆矩阵 $P$ ，使：
在这里插入图片描述
则称 $B$ 是 $A$ 的相似矩阵，或者说 $A$ 和 $B$ 相似。

2.2 解释

在这里插入图片描述
那怎么得到不同基下的矩阵呢? 这里看下具体的变换细节。

2.2.1 细节

首先看一个图，下面给出关于图的解释：
在这里插入图片描述

有两个基： $V_1:\{\overrightarrow{i},\overrightarrow{j}\}$ 和 $\{\overrightarrow{i'},\overrightarrow{j'}\}$
$V1\to V2$ ，可以通过 $P^{-1}$ 转换
$V2\to V1$ ，可以通过 $P$ 转换

整个转换的核心如下：

在这里插入图片描述
对上面的图进行解释：

$\overrightarrow{v'}$ 是 $V_2$ 的点
$\overrightarrow{v'}$ 通过 $P$ 变为 $V_1$ 下的点，即 $P\overrightarrow{v'}$
在 $V_1$ 下，通过矩阵 $A$ 完成线性变换，即 $AP\overrightarrow{v'}$
通过 $P^{-1}$ 变回 $V_2$ 下的点，即 $P^{-1}AP\overrightarrow{v'}$

综上，我们可以有：
在这里插入图片描述
我们可以认为：

那么B和A互为相似矩阵。

这里还有一个细节： $V_2\to V_1$ 的转换矩阵 $P$ 是什么？
首先看空间中的一个点，假设为 $m$ 点：
在这里插入图片描述
这时我们知道，不管有没有基，这个点都是客观存在的，然后给出其在 $\overrightarrow{i'},\overrightarrow{j'}$ 的坐标 $\overrightarrow{v'}$ ：

为了表示 $\overrightarrow{v'}$ 是 $\overrightarrow{i'},\overrightarrow{j'}$ 下的坐标，我们写成这样：
在这里插入图片描述
如果我们知道了 $\overrightarrow{i'},\overrightarrow{j'}$ 在 $\overrightarrow{i},\overrightarrow{j}$ 下的坐标：

那么有：
$\overrightarrow{v'}=a\overrightarrow{i'}+\overrightarrow{j'}=a(c\overrightarrow{i}+d\overrightarrow{j})+b(e\overrightarrow{i}+f\overrightarrow{j})$

此时，实际上m点的坐标，已经变到了 $\overrightarrow{i},\overrightarrow{j}$ 下的 $\overrightarrow{v}$ ：
在这里插入图片描述
继续推导：

所以P其实就是：

这里的 $\overrightarrow{i'},\overrightarrow{j'}$ 是在 $\overrightarrow{i},\overrightarrow{j}$ 下的坐标。

2.2.2 对角矩阵

为什么我们需要相似矩阵呢？
比如A这个矩阵：
在这里插入图片描述
可以这样分解：

其中：

在这里插入图片描述
B就是对角矩阵，看上去好看很多，相似变换其实就是坐标转换，转换到一个更方便计算的简单坐标系。

https://www.matongxue.com/madocs/491.html

2.3 相似的性质：

反身性： $A\backsim A\quad(I^{-1}AI=A)$
对称性： $A\backsim B\rArr B\backsim A$
$(A\backsim B\rArr P^{-1}AP=B\rArr A=(P^{-1})^{-1}BP^{-1})$
传递性： $A\backsim B,B\backsim C,\rArr A\backsim C$
$P_1^{-1}AP_1=B,P_2^{-1}BP_2=C$
$\therefore P_2^{-1}P_1^{-1}AP_2P_1=C$
$\therefore (P_1P_2)^{-1}A(P_1P_2)=C$
相似矩阵的秩相同

三、对角矩阵

3.1 矩阵可对角化

如果矩阵 $A$ 能与对角矩阵相似，则称 $A$ 可对角化
例子：
设 $A=\begin{bmatrix}1&1\\2&2\end{bmatrix},P=\begin{bmatrix}1&-1\\2&1\end{bmatrix}$ ，则有：
$P^{-1}AP=\begin{bmatrix}3&0\\0&0\end{bmatrix}$
即： $A\backsim\begin{bmatrix}3&0\\0&0\end{bmatrix}$
从而 $A$ 可对角化

3.2 可对角化的条件

3.2.1 定理1：n阶矩阵A可对角化的充分必要条件是A有n个线性无关的特征向量

证明：
必要性：
如果A可对角化，则存在可逆矩阵P，使得：
$A=\begin{bmatrix}\lambda_1&0&0&\dots&0\\0&\lambda_2&0&\dots&0\\\vdots&\dots&\dots&\ddots&\vdots\\0&0&0&\dots&\lambda_n\end{bmatrix}$

将P按列分块得到 $P=[X_1,X_2,...,X_n]$ ，从而有：

$AP=A[X_1,X_2,...,X_n]=P\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix}=[X_1,X_2,...,X_n]\begin{bmatrix}\lambda_1&0&\dots&0\\0&\lambda_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&\lambda_n\end{bmatrix}$
因此有：
$AX_i=\lambda_iX_i\quad(i=1,2,...,n)$ ，所以 $X_i$ 是A的属于特征值 $\lambda_i$ 的特征向量，又由P可逆，知 $X_1,X_2,...,X_n$ 线性无关，故A有n个线性无关的特征向量。

3.2.2 定理2：矩阵A的属于不同特征值的特征向量是线性无关的

3.2.3 推论1：若n阶矩阵有n个互不相同的特征值 $\lambda_1,\lambda_2,...,\lambda_n$ ，则A可对角化，且：

在这里插入图片描述

3.2.4 定理三

在这里插入图片描述

https://wenku.baidu.com/view/58dcd9d376eeaeaad1f33024.html

3.3 对角矩阵的性质

3.3.1 对角矩阵的秩等于其对角线上非零元素的个数。

四、可逆矩阵

4.1 定义

设A为n阶方阵，若存在n阶方阵B，使得：
$AB=BA=I$
则称A为可逆矩阵，B为A的逆矩阵，记为 $A^{-1}=B$

单位矩阵I：
$I^{-1}=I$
$(kI)^{-1}={1\over k}I,(k\ne0)$

对角矩阵：

D= $\begin{bmatrix}d_1&0&\dots&0\\0&d_2&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&d_n\end{bmatrix},(d_1,d_2,...d_n\ne0);\quad D^{-1}=\begin{bmatrix}{1\over d_1}&0&\dots&0\\0&{1\over d_2}&\dots&0\\\vdots&\dots&\ddots&\vdots\\0&0&\dots&{1\over d_n}\end{bmatrix}$

4.2 定理

4.2.1 定理1：设A可逆，则它的逆是唯一的

证明：
设有B和C满足：AB=BA=I，AC=CA=I
则：B=BI=B(AC)=(BA)C=IC=C

4.2.2 定理2：设A为n阶矩阵，则下列命题等价：

A是可逆的
AX=0只有零解
$1\to2：设A是可逆的，且X是AX=0的解，则：$
$X=IX=(A^{-1}A)X=A^{-1}(AX)=A^{-1}0=0$
所以，AX=0只有零解
A与I行等价
$2\to3：A经过初等行变换到B（行阶梯矩阵）$
$BX=0只有零解，B的对角元均非零，否则B的最后一行的元全为零，则BX=0有非零解（矛盾）$
$则，B经初等行变换后得到的行最简化矩阵=I$
A可表为有限个初等矩阵的乘积
$3\to4：由3，可得A可经初等行变换得到I，所以存在初等矩阵E_1,E_2,...E_k，使得E_k,...E_1A=I$
$A=E_1^{-1}....E_k^{-1}I=E_1^{-1}...E_k^{-1}$

4.2.3 推论：设A为n阶矩阵，则AX=b有唯一解的充要条件是A可逆

证明：
充分性：
$AX=b有唯一解：X=A^{-1}b$
必要性：
$设AX=b有唯一解X，但A不可逆$
$A不可逆\rArr AX=0有非零解Z$
$令Y=X+Z$
$AY=A(X+Z)=AX+AZ=b+0=b$
$则Y为AX=b的解，矛盾$
所以可得A可逆

4.3 性质

设A，B皆为n阶可逆矩阵，数 $\lambda\ne0$ ，则：

$A^{-1}$ 可逆，且 $(A^{-1})^{-1}=A$
$\lambda A$ 可逆，且 $(\lambda A)^{-1}={1\over\lambda}A^{-1}$
$AB$ 可逆，且 $(AB)^{-1}=B^{-1}A^{-1}$
$(AB)(B^{-1}A^{-1})=A(BB^{-1})A^{-1}=AA^{-1}=I$
$A^T$ 可逆，且 $(A^T)^{-1}=(A^{-1})^T$
$A^T(A^{-1})^T=(A^{-1}A)^T=I$
逆矩阵行列式和原矩阵行列式的关系

https://wenku.baidu.com/view/84eda27b27284b73f24250ce.html?sxts=1591611918853

五、过渡矩阵

过渡矩阵是基与基之间的一个可逆线性变换，在一个空间V下可能存在不同的基。假设有两组基分别为A，B。由基A到基B可以表示为B=AP，过渡矩阵 $P=A^{-1}B$ ，它表示的是基与基之间的关系。