版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_31880107/article/details/86592135
1. 矩阵求导法则
矩阵的求导分为:标量求导、向量求导、矩阵求导三个方面。
1.1 标量求导
- 矩阵和向量对标量求导,只需矩阵中的每个量都对标量进行求导,这个很好理解。
- 标量对矩阵的向量求导,也是同样的,等价于标量对矩阵的每个分量进行求导,并且保持维数不变。
举例。设
y为一个标量,
xT=[x1x2⋯xn]为一个行向量,则:
∂xT∂y=[∂x1∂y⋯∂xn∂y]
1.2 向量求导
对于向量求导,我们可以将向量看做一个标量,先使用上面的标量求导法则,最后将向量形式化为标量进行。
举例,
设
yT=[y1⋯yn] 是一个行向量,
x=⎣⎢⎡x1⋮xm⎦⎥⎤是一个列向量。
则
∂x∂yT=[∂x∂y1⋯∂x∂yn]=⎣⎢⎡∂x1∂y1⋮∂xm∂y1⋯⋱⋯∂x1∂yn⋮∂xm∂yn⎦⎥⎤
1.3矩阵求导
与向量求导类似,先将矩阵当做一个标量,再使用标量的求导法则。
举例,
设
Y=⎣⎢⎡y11⋮yn1⋯⋱⋯y1m⋮ynm⎦⎥⎤是
n∗m矩阵,
x=[x1,⋯,xp]是
p维列向量,则
∂x∂Y=[∂x1∂Y,⋯,∂xp∂Y]