我们一般对函数求导,是对单变量求导,但是在机器学习中,会遇到多元函数对向量求导的情况,比如:
f(w
)=21∣∣w
∣∣2其中,
w
=(w1,w2,⋯,wn)
我们会看到在数学公式推导中会遇到函数对向量的求导:
∂w
∂f(w
)=∂w
21(w12+w22+⋯+wn2)
=∂(w1,w2,⋯,wn)21(w12+w22+⋯+wn2)
=(∂w1∂f(w
),∂w2∂f(w
),⋯,∂wn∂f(w
))
=(w1,w2,⋯,wn)=w
所以我们可以看出,一个函数对于一个向量求导,得到一个向量,这个向量的每一维,相当于是这个函数对原始向量的每一维上的变量进行求导,本质上就是求了
f(w
)关于
w
的梯度
∇f(w
)。