版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_25847123/article/details/86318533
申明:仅个人小记
前言:主要用来解释SVM中
{wTxi+b≥+1,yi=+1;wTxi+b≤−1,yi=−1由来的逻辑。出现的+1和-1有点突兀。
约定
(1) 决策面是一个超平面
(2) 有效决策面指的是能将训练样本完全正确分开的决策面
(3) 决策面的方向指的是该决策面的法向量
(4) 训练集中的样本分为A类和B类。假定A类出现在决策面的正方向一侧,B出现在决策面负方向一侧
正文
(1)基于假设
假设找到了一个有效决策面
wTx+b=0,则该决策面的方向是
w.
(2)移动决策面
让上述决策面沿着
w的正方向移动,一旦碰到 A类的样本 立即停止移动 ,此时与该样本相交的平面记为
wTx+b=k1,(k1≥0)(因为是沿着决策面的法向量方向移动的,所以这个新的平面的方向也是
w),称为A侧决策面。同时,这个相交的样本被称为 支撑向量;同理,沿着
w反向移动得到新的平面记为
wTx+b=k2,(k2≤0),称为B侧决策面。
(3)调整原来的决策面
我们希望有效决策面是处于A、B两类样本的正中间,而不是偏向于某一类。而刚开始基于假设提供的有效决策面
wTx+b=0不一定是我们所希望的处于正中间的,故而需要做出调整
wTx+b=0→wTx+b′=0使得
wT+b′=0夹在
{wTx+b=k1,(k1≥0)wTx+b=k2,(k2≤0)这两个平面正中间,即
b′=2b−k1+b−k2=b−2k1+k2,即正中间平面为
wTx+b=2k1+k2→wTx+b′=0.
(4)计算到正中间平面的距离
由
{wTx+b=k1,(k1≥0)wTx+b=k2,(k2≤0)和
wTx+b=2k1+k2可分别计算出A、B两侧侧决策面到正中间平面的距离为
dA=∥w∥∣∣wTx+b−2k1+k2∣∣=∥w∥∣∣k1−2k1+k2∣∣=∥w∥∣∣2k1−k2∣∣
dB=∥w∥∣∣wTx+b−2k1+k2∣∣=∥w∥∣∣k2−2k1+k2∣∣=∥w∥∣∣2k2−k1∣∣显然,
d=dA=dB
(5)对A、B两侧决策面形变
由(3)知道
b=b′+2k1+k2,故
{wTx+b=k1,(k1≥0)wTx+b=k2,(k2≤0)→{wTx+b′=2k1−k2,(k1≥0)wTx+b′=2k2−k1,(k2≤0)
再结合(4)得,
{wTx+b′=2k1−k2,(k1≥0)wTx+b′=2k2−k1,(k2≤0)→{dwTx+b′=dk1−k2=+1,(k1≥0)dwTx+b′=dk2−k1=−1,(k2≤0)令
w′=dw,b′′=db′,则A、B两侧决策面更变为
{w′Tx+b′′=+1,(k1≥0)w′Tx+b′′=−1,(k2≤0)此时契合了和文章开头的式子,以上就是该式子的逻辑由来。