【ISL-2】什么是统计学习

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/u011240016/article/details/84765443

假设我们有p个特征, X 1 , X 2 , . . . , X p X_1, X_2,...,X_p ,观察变量 Y Y 和这些特征是否存在某种关联。我们先假设它们之间存在着一些关联,令:

X = ( X 1 , X 2 , . . . , X p ) X = (X_1, X_2,...,X_p) ,则:

Y = f ( X ) + ϵ Y = f(X) + \epsilon

这里的f是不可知的,如果可知的话,还要机器学习干嘛,学习的目标是成长,是去追求。而如果追求的胜利果实已经在手,则再耗费精力学习出什么东西来,实无必要。

这里的 ϵ \epsilon 是随机误差,且独立于 X X ,均值为0.

这里说的东西,其实从最简单的开始演化会更加容易理解:

y = f ( x ) + ϵ y = f(x) + \epsilon ,这里的 y , x y,x 都是实数,意思是说,输入就一个变量,现在想知道 y y 和这个单输入的关系。

上面这个是我们非常熟悉的模型,现在,输入不止一个变量,于是模型就成了:

Y = f ( X ) + ϵ Y = f(X) + \epsilon

本质上说,统计学习指代的是一系列估计 f f 的方法。那么围绕着估计 f f 的过程,我们会涉及到:

  • 一些关键理论
  • 评估模型好坏的工具

理论能够指引我们前进的方向,评估工具是我们反思并再改进的倚仗。

END.

猜你喜欢

转载自blog.csdn.net/u011240016/article/details/84765443