我的微信公众号名称:AI研究订阅号
微信公众号ID:MultiAgent1024
公众号介绍:主要研究强化学习、计算机视觉、深度学习、机器学习等相关内容,分享学习过程中的学习笔记和心得!期待您的关注,欢迎一起学习交流进步!
我们曾在线性代数里学过向量空间,它是由向量做成的集合。在这个集合里向量可以相加,向量可以乘以一个倍数,由此我们可以讨论向量的线性组合、向量的线性相关等概念。
线性空间的概念
线性空间
如果上述运算满足以下规则,则称
V为数域
P上的线性空间。
V中的元素也称为向量。
- 对任意的
α,
β
∈
V,则称
V为数域
P上的线性空间,
V中的元素也称为向量。
- 对任意的
α,
β,
γ,
∈
V,
(α+β)+γ=α+(β+γ);
- 在
V中存在一个零元素,记作
0,对任意的
α+0=α;
- 对任意的
α∈V,都有
α的负元素,记作
−α;
- 对任意的
α∈V,有
1⋅α=α;
- 对任意的
α∈V,
k,l∈P,
k(lα)=(kl)α;
- 对任意的
α∈V,
k,l∈P,
(k+l)α=kα+lα
- 对任意的
k∈P,
α,β∈V,
k(α+β)=kα+kβ
线性空间的例子,基底、坐标
-
定义1.3:(线性相关)在
V中有一组元素
α1,
α2,
⋯,
αn线性无关,且其他元素都可以被它们线性表达,则称
α1,
α2,
⋯,
αn为
V的一组基,
n为空间
V的维数,记作
dimV=n,而表达式的系数是这个元素的坐标。
-
例题: 求
P3[t]中多项式
1+t+t2在基底1,
t−1,
(t−2)(t−1)下的坐标:
解:
1+t+t2=k1×1+k2×(t−1)+k3(t−2)(t−1)
令其对应项相等即可。
基变换与坐标变换
一般来说,一个元素在不同的基底下有不同的坐标,它们的坐标有什么关系呢?
设
V是
P上的
n维线性空间,
α1,
α2,
⋯,
αn和
β1,
β2,
⋯,
βn是
V的两个不同的基底,因为
α1,
α2,
⋯,
αn是基底,所以
β1,
β2,
⋯,
βn可以被这个基底线性表达,这两个基底的关系是:
(β1,β2,⋯,βn)
=(α1,α2,⋯,αn)A
利用过渡矩阵就可以得到这个元素的两个坐标之间的关系:
α=(β1,β2,⋯,βn)⎝⎜⎜⎜⎛l1l2⋮ln⎠⎟⎟⎟⎞
=(α1,α2,⋯,αn)A⎝⎜⎜⎜⎛l1l2⋮ln⎠⎟⎟⎟⎞
=(α1,α2,⋯,αn)⎝⎜⎜⎜⎛k1k2⋮kn⎠⎟⎟⎟⎞
⎝⎜⎜⎜⎛k1k2⋮k2⎠⎟⎟⎟⎞=A⎝⎜⎜⎜⎛l1l2⋮ln⎠⎟⎟⎟⎞
子空间和维数定理
子空间及生成方式
我们知道三维线性空间
R3的二维平面
R2也是一个线性空间,这种类型的空间叫作子空间。
-
定义1.5:设
V是数域
P上的线性空间,
W是
V的非空子集,如果
W对于线性空间
V所定义的加法运算及数乘运算也构成
P上的线性空间,则称
W为
V的线性子空间,简称子空间。
-
定理1.1:设
W是
P上的线性空间
V的非空子集,则
W是
V的线性子空间的充要条件是:
1):若
α,β∈W,则
α+β∈W;
2):若
α∈W,
k∈P,则
kα∈W。
{0}及
V本身也是
V的子空间,这两个子空间是
V的平凡子空间。
-
设
α1,
α2,
⋯,
αm是
V上的
m个元素,由这
m个元素的任意组合构成的集合
{k1α1+⋯+kmαm}对
V中的加法及数乘封闭,因而这个子集是
V中的子空间。记作:
L(α1,α2,⋯,αm)
- 用原有的子空间生成新的子空间的方法:
1):设
V1,
V2是
V的子空间,则
V1∩V2是
V的子空间,叫做两个子空间的交子空间。
2):设
V1,
V2是
V的子空间,
V1+V2也是
V的子空间,这里:
V1+V2={α1+α2∣α1∈V1,α2∈V2}
这个子空间叫做
V1和
V2的和子空间。
维数定理
由两个子空间
V1,
V2生成的子空间的维数
dim(V1+V2),
dim(V1∩V2)与原来的子空间的维数之间有一个关系,称之为维数定理,即:
dimV1+dimV2
=dim(V1+V2)+dim(V1∩V2)
- 定理1.2:
V1+V2是直和的充要条件是
V1∩V2={0}。
这个几个概念比较重要,需要记住。
线性空间中的线性变换
- 定义1.6:设
T是
V上的变换,如果对于任意的
α,
β∈V及
k∈P都有:
T(α+β)=Tα+Tβ
T(kα)=kTα
则称
T为
V上的线性变换。线性变换保持
V上的运算。
上面这个线性变换的公式需要记住,经常会考这个改变以及以下变种。比如下文的线性变换的矩阵的公式:
由:
(ε1,ε2,ε3)=(e1,e2,e3)C
能得到:
T(ε1,ε2,ε3)=T(e1,e2,e3)C
这时如果知道:
T(ε1,ε2,ε3)=(ε1,ε2,ε3)A
即可求出:
T(e1,e2,e3)=T(ε1,ε2,ε3)C−1
等于:
T(e1,e2,e3)=(ε1,ε2,ε3)AC−1
等于:
T(e1,e2,e3)=(e1,e2,e3)CAC−1
(T1+T2)α=T1α+T2α,(kT1)α=k(T1α)
可以证明,线性空间中的所有线性变换也做成一个线性空间,记作
L(V)
- 即用线性变换,定义的子空间,一个是像子空间,一个是核子空间。
像:
TV={Tα∣α∈V}
核:
T−1(0)=kerT={α∣α∈V,Tα=0}。
像子空间是由
V中所有元素的像构成的,即任取
β∈TV,则一定存在
α∈V,使得
β=Tα。
核子空间是由所有
α中的一些元素构成的,这些元素在线性变换的作用下是零。
- 定理1.3(维数定理):设
T是
n维空间上的线性变换,则
dimTV+dimT−1(0)=n
线性变换的矩阵
V上的所有线性变换构成的子空间是一个比较抽象的空间,我们知道一些具体的线性变换,但是任意一个线性变换是什么样子的,怎么表达呢?
设
α∈V,
α=i=1∑nkiαi=(α1,α2,⋯,αn)⎝⎜⎜⎜⎛k1k2⋮kn⎠⎟⎟⎟⎞
Tα=(Tα1,Tα2,⋯,Tαn)⎝⎜⎜⎜⎛k1k2⋮kn⎠⎟⎟⎟⎞
=i=1∑nkiTαi
可以看出,决定线性变换结果的是:
Tα1,Tα2⋯,Tαn
即基底在这个线性变换之下变成了什么形式。
因为
Tα1,Tα2⋯,Tαn,仍然是
V中的元素,当然可以被
V的基底表达:
⎩⎪⎪⎪⎨⎪⎪⎪⎧Tα1=a11α1+⋯+an1αnTα2=a12α1+⋯+αn2αn⋮Tαn=a1nα1+⋯+annαn
A=(aij)n×n为线性变换
T在基底
α1,⋯,αn下的矩阵。
可见每一个线性变换实际上与一个矩阵相对应,反过来,每一个矩阵也对应一个线性变换,即给定一个矩阵
A,只要定义:
(Tα1,Tα2,⋯,Tαn)=(α1,α2,⋯,αn)A
则这个矩阵对应一个线性变换。