机器学习之凸优化

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_16633405/article/details/82286555

目录

1、了解凸集和仿射集的基本概念。

凸集:在凸集内部的两个点之间的线段仍在图形内,则称这个图形为凸集。
仿射集:通过集合中任意两个不同点的直线仍然在这个集合内则称为这个集合的仿射集。
仿射集说的是直线,凸集说的是线段。
这里写图片描述
这里写图片描述

2、知道几何体的向量表达。

两个θ+(1-θ)=1代表的是两个点之间的关系是直线关系,如果不等于1则代表是其他的非线性的关系。
这里写图片描述
这里写图片描述

3、了解超平面和半空间的概念。

超平面:如下图所示,将线性方程转化为矩阵的形式,然后(2,3)可以用向量a(已知点的向量)表示,(x,y)可以用向量x来表示,常数可以用b来表示。即若在2维空间中表示则超平面是一条直线,若a为N维向量(即在N维空间中表示),则式子可表示为一个N维空间中的超平面方程。
半空间:如下图所示的2x+3y=1这条直线的一半即代表半空间,表示形式如下图所示
这里写图片描述
这里写图片描述
2维空间中超平面是一条直线,3维中是一个平面。。。半空间就是超平面的一半的空间称为半空间。

4、了解分割超平面和支撑超平面的含义。

分隔超平面:将两个超平面分割的平面称为分割超平面。即两个凸集内部的两个点d和c的连线的最短距离的垂直平分线即为这两个凸集的分割超平面。
这里写图片描述
支撑超平面:对于一个图形,通过它的任意边上画切线,如果图形在切线的一边则证明该图形是凸集组成的图形。若不是则证明该图形非凸集。可以把这个切线称为支撑超平面。
如果一个集合任何一个点都存在支撑超平面则这个集合是凸集。
这里写图片描述

5、知道jensen不等式。

jenson不等式可以转化为f(E(x))<=E(f(x)),无论x是连续的或者是离散的。

6、掌握知识:凸函数。

数学含义:凸函数定义式可以理解为一个函数,它的割线总是在函数的上方,则可称该函数是凸函数,如下图所示。
这里写图片描述

7、掌握凸优化

凸优化:基本形式如下所示,即任何问题都可以转化为求f0(x)的最小值,而对于f0(x)存在两个限制条件 Fi(x)(代表的是若干个不等式约束条件)与Hj(x)(代表的是若干个等式约束条件)。
这里写图片描述
对于最终的最优化值我们不关心,而是关心对应的x的值
最优值的公式数学含义:在什么样的条件下求对应的F0(x)的下确界
这里写图片描述
由对应的限制条件可得lagrange函数中的Hj(x)为0。
对偶函数通过梯度来求极大值。
这里写图片描述
这里写图片描述

将Lagrange函数转化为求它的对偶函数,而Lagrange对偶函数为凹函数,则凹函数的最大值也就对应原函数的最小值。
这里写图片描述
我们求得是最小值。通过下面的推导也就转化为求对偶函数。
由于Hj(x)=0所以原式转化为g(λ)。
PS:下图中的h(x)改为f(x),h(x)=0了,已经被舍掉了。
这里写图片描述
整体的过程:优化问题,优化的形式是固定,即问题可以转化为一个表达式F(x)外加两个限制条件的表达式。即任何问题都可以转化为求f0(x)的最小值,而对于f0(x)存在两个限制条件 Fi(x)与Hj(x)。
将凸优化问题转化为Lagrange函数,再将Lagrange函数转化为求它的对偶函数,而Lagrange对偶函数为凹函数,则凹函数的最大值也就对应原函数的最小值,即可得凸优化问题的解。

猜你喜欢

转载自blog.csdn.net/qq_16633405/article/details/82286555