一般的线性回归是由
(x1,x2,...,xn)预测
y,损失函数采用均方差函数
MSE=m1∑i=1n∥∥y^2−y2∥∥2。
想象输入同样的X,预测值
y^2有很多个。输入同样的X,普通线性回归的预测值只有一个,这里假设预测值服从某个分布。这里采用
p(y∣X)表示
y出现的概率。
线性回归函数为
y=θTx+ϵ
假设
p(y∣X)服从正态分布,即
p(y∣X)=N(y;0,σ2),
也即
ϵ∼N(y;0,σ2),
似然函数为
L(θ)=∏i=1mp(ϵ)=∏i=1m2π
σ1e−2σ2ϵ2
=(2π
σ1)me−∑i=1m2σ2ϵ2
取对数可以得到
lnL(θ)=−mln(2π
)−mln(σ)−∑i=1m2σ2ϵ2
=−2mln(2π)−mln(σ)−2σ21∑i=1m(y−θTX)
由上式可以看出,利用极大似然估计得出的对数似然函数与均方差相似,最大化对数似然与最小化均方差会得到相同的参数。