假设两条平行直线分别是
Wx+A=0,(1)
与
Wx+B=0.(2)
那么和这两条直线平行,且位于中间的那条直线就可以表示成:
Wx+A+2B−A=0.(3)
令
t=B−A,则有
B=t+A。
将
t=B−A 代入(3),得到
Wx+A+2t=0.(4)
将
B=t+A 代入(2),得到
Wx+t+A=0.(5)
整理一下,这三条直线现在可以写成
Wx+A=0,(6)
Wx+t+A=0,(7)
Wx+A+2t=0.(8)
下面给等式(6)左右都加上
2t,给等式(7)左右都减去
2t,得到
Wx+A+2t=2t,(9)
与
Wx+A+2t=−2t.(10)
接下来将等式(8)、(9)、(10)的两边都乘以
t2,得
t2Wx+t2(A+2t)=0,(11)
t2Wx+t2(A+2t)=1,(12)
t2Wx+t2(A+2t)=−1.(13)
令
w=t2W,
b=t2(A+2t),则等式(11)、等式(12)、等式(13)又可以写成:
wx+b=0,(14)
wx+b=1,(15)
wx+b=−1.(16)
化简成这样的主要原因是,间隔(margin)的表达式最简单。
可以假设向量
x1 在
wx+b=1 上,向量
x2 在
wx+b=−1 上,间隔(margin)的表达式为
margin=d=∣x1−x2∣⋅cosθ.(17)
其中
θ 是
向量x1−x2 与平行直线的法向量
w 的夹角。
为了利用向量的工具,我们可以在等式(17)两边都乘以
∣w∣,则有
d⋅∣w∣=∣x1−x2∣⋅∣w∣⋅cosθ=∣w(x1−x2)∣.(18)
又因为向量
x1 在
wx+b=1 上,向量
x2 在
wx+b=−1 上,则
wx1+b=1,
wx2+b=−1.
所以
∣w(x1−x2)∣=∣wx1−wx2∣=∣1−b−(−1−b)∣=2=d⋅∣w∣.
所以
d=∣w∣2.