支持向量机学习笔记

参考链接：https://blog.csdn.net/v_JULY_v/article/details/7624837

支持向量机是一种基于统计学习理论的监督式学习的模式识别方法。

SVM是从线性可分情况下的最优分类面发展而来的，基本思想可用下图的两类线性可分情况说明。实心点和空心点代表两类样本，实线P0、P1为分类线。两个虚线分别为过各类中离分类线最近的样本且平行于分类线的直线，它们之间的距离叫做分类间隔。

训练集为非线性的情况，可以通过适当的非线性变换将数据映射到高维空间当中，来解决原始空间中线性不可分的问题。

高维空间只需要用到内积运算没永远是空间中的函数即可实现，没有必要知道变换的形式。在最优分类面中采用适当的内积函数 $K({\rm{x,x}}_{\rm{i}} )$ 就可以实现某一非线性变换后的线性分类，而计算复杂度并没有增加。

核函数的本质：

实际中，我们会经常遇到线性不可分的样例，此时，我们的常用做法是把样例特征映射到高维空间中去。但进一步，如果凡是遇到线性不可分的样例，一律映射到高维空间，那么这个维度大小是会高到可怕的。此时，核函数就隆重登场了，核函数的价值在于它虽然也是讲特征进行从低维到高维的转换，但核函数绝就绝在它事先在低维上进行计算，而将实质上的分类效果表现在了高维上，也就如上文所说的避免了直接在高维空间中的复杂计算。
常见的核函数：

多项式核函数。 $K({\rm{x,x}}_{\rm{i}} ) = [({\rm{x,x}}_{\rm{i}} ) + 1]^q$
径向基函数（RBF）。 $K({\rm{x,x}}_{\rm{i}} ) = \exp (\frac{{\left| {x - x_i } \right|^2 }}{{\sigma ^2 }})$