证明总偏差平方和 = 回归平方和 + 残差平方和

线性回归中有这样一条性质：
$总偏差平方和 (SST) = 回归平方和（SSR） + 残差平方和（SSE）$

即：
$\sum(y_i-\overline y)^2=\sum(\hat y_i-\overline y)^2+\sum(y_i-\overline y)^2\tag{1}$

证明：下面以一元回归为例证明。
$\begin{aligned} \sum(y_i-\overline y)^2&=\sum(y_i-\hat y_i+\hat y_i-\overline y)^2\\ &=\sum(y_i-\hat y_i)^2+\sum(\hat y_i-\overline y)^2+2\sum(y_i-\hat y_i)(\hat y_i-\overline y)\\ \end{aligned}$

因此，我们需要证明 $\sum(y_i-\hat y_i)(\hat y_i-\overline y)=0$ .

$\begin{aligned} \sum(y_i-\hat y_i)(\hat y_i-\overline y)&=\sum(y_i-\hat y_i)\hat y_i-\overline y\sum (y_i-\hat y_i)\\ \end{aligned}\tag{2}$

根据最小二乘法，若回归方程为： $y=\beta_0+\beta_1x$ ，优化目标是使得 $f=\sum (y_i-\beta_0+\beta_1x_i)^2$ 最小，通过令一阶导数 $f$ 为零计算 $\beta_0, \beta_1$ ：
$\begin{aligned} \frac{\partial f}{\partial \beta_0}=-2\sum(y_i-\beta_0+\beta_1x_i)=0 \end{aligned}$
由于 $\hat y_i=\beta_0+\beta_1x_i$ ，所以
$\sum (y_i-\hat y_i)=0\tag{3}$

又因为：
$\begin{aligned} \frac{\partial f}{\partial \beta_1}=2\sum x_i(y_i-\beta_0+\beta_1x_i)=0 \end{aligned}$

所以，
$\sum (\beta_0+\beta_1x_i)(y_i-\beta_0+\beta_1x_i)=\sum\hat y_i(\hat y_i-y_i)=0\tag{4}$

综合表达式（2）,（3）,（4），表达式（1）成立。因此：
$总偏差平方和 (SST) = 回归平方和（SSR） + 残差平方和（SSE）$
$\Box$

心态与做事习惯决定人生高度博客专家

发布了280 篇原创文章 · 获赞 496 · 访问量 146万+

他的留言板关注

证明 总偏差平方和 = 回归平方和 + 残差平方和

猜你喜欢

证明总偏差平方和 = 回归平方和 + 残差平方和