最优化方法:二、数学基础

主要参考书目:
1. 最优化方法及其应用/郭科,陈聆,魏友华.-北京:高等教育出版社,2007.7(2013.7重印)

1、二次型与正定矩阵

2、方向导数与梯度

3、Hesse矩阵及泰勒展式

  • Hesse(/ˈhɛsə/)矩阵
    2 f ( X 0 ) = [ 2 f ( X 0 ) x 1 2 2 f ( X 0 ) x 1 x 2 2 f ( X 0 ) x 1 x n 2 f ( X 0 ) x 2 x 1 2 f ( X 0 ) x 2 2 2 f ( X 0 ) x 2 x n 2 f ( X 0 ) x n x 1 2 f ( X 0 ) x n x 2 2 f ( X 0 ) x n 2 ]

    容易发现,当f在 X 0 处二阶偏导连续时,Hesse矩阵对称。
  • 多元向量函数的导数
    H : R n R m , X 0 R n ,记 H ( X ) = [ h 1 ( X ) , h 2 ( X ) , , h m ( X ) ] T ,在存在的前提下,其导数为:
    m × n H ( X 0 ) = [ h 1 ( X 0 ) x 1 h 1 ( X 0 ) x 2 h 2 ( X 0 ) x n h 2 ( X 0 ) x 1 h 2 ( X 0 ) x 2 h 2 ( X 0 ) x n h n ( X 0 ) x 1 h n ( X 0 ) x 2 h n ( X 0 ) x n ]
  • 泰勒展开
    f : R n R 1 具有二阶连续偏导数,则
    f ( X + P ) = f ( X ) + f ( X ) T + 1 2 P T 2 f ( X ) P + o ( | | P | | 2 ) .


    f ( X + P ) = f ( X ) + f ( X ) T + 1 2 P T 2 f ( X ¯ ) P .

    其中 X ¯ = X + θ P ,而 0 < θ < 1 .
  • 几个公式
    1. n元函数求导和1元函数求导在形式上是一致的:
      例如:
      f ( X ) = 1 2 X T A X + b T X + c


      f ( X ) = A X + b 2 f ( X ) = A
    2. 函数梯度的Jacobi矩阵即为此函数的Hesse矩阵。
      n × n f ( X ) = 2 f ( X )
    3. ϕ ( t ) = f ( X 0 + t P ) ,其中 f : R n R 1 , ϕ : R 1 R 1
      则:
      ϕ ( t ) = f ( X 0 + t P ) T P ϕ ( t ) = P T 2 f ( X 0 + t P ) T P

4、极小点的判定条件

  • X 是局部极小点+ X 是内点 f ( X ) = 0
  • f ( X ) = 0 + X 是内点 X 是驻点

5、锥、凸集、凸锥


  • 设集合 C R n . X C 及任意的数 λ 0 ,均由 λ X C ,则称C为锥。
  • 凸组合
    凸组合
    更多有关内容
  • 凸集
    凸集
    特别地,规定空集是凸集。
    更多有关内容
  • 半空间
    a R n a 0 , b R 1 ,则集合 { X | a T X > b , X R n } 称为 R n 中的半空间。
    也就是广义平面分割全空间产生的两部分。
  • 几个定理
    1. 凸集的交集仍是凸集。
    2. 首先引入三个概念:
      锥+凸集=凸锥;凸集+闭集=闭凸集;凸锥+闭集=闭凸锥;
      有定理:
      C为凸集 X i C , λ i 0 ( i = 1 , 2 , , k , k 2 ) , i = 1 k λ i = 1 , i = 1 k λ i X i C .
      C为凸锥 X i C , λ i 0 ( i = 1 , 2 , , k , k 2 ) , i = 1 k λ i X i C .
      有限个半空间的交为多面集。
      多面集
  • 极点
    设C为非空凸集, X C ,若X不能表示成C中两个不同点的凸组合,换言之,若能表示成两点的凸组合,必有 X 1 = X 2 = X ,则称X是凸集C的极点。
    *类似平面凸多边形的顶点。
  • 极方向
    设C为 R n 中的闭凸集,P为非零向量,如果对C中的每一个X都有射线 { X + λ P | λ 0 } C ,则称向量P为C的方向。又设 P 1 P 2 是C的两个方向,若对任何正数 λ ,有 P 1 λ P 2 ,则称 P 1 P 2 是两个不同的方向。若C的方向P不能表示成该集合的两个不同方向的正的线性组合,则称P为C的极方向。
    -几个定理
    C = { X | A X = b , X 0 } 为非空集合,P是非零向量,P为C的方向的充要条件是 P 0 A P = 0
    定理
  • 凸集分离定理
    凸集分离定理

6、凸函数

  • 一系列定义与性质
    1
    2
    下半连续
    下半连续
  • 凸函数与凸集的关系
    1
    2
    3
  • 凸规划
    1
    这个结论很强的,但就是条件太苛刻。
    2
    则称为二次凸规划问题。(补图上不全处)

约束问题的最优性条件

  • 约束优化问题的分类
    (1) IP型
    m i n f ( X ) , s . t . g i ( X ) 0 , i = 1 , 2 , , l .

    (2) EP型
    m i n f ( X ) , s . t . h j ( X ) = 0 , j = 1 , 2 , , m .

    (3) GP型
    m i n f ( X ) , s . t . { g i ( X ) 0 , i = 1 , 2 , , l . h j ( X ) = 0 , j = 1 , 2 , , m .
  • 一阶必要条件
    (1)起作用的约束与不起作用的约束
    起作用的约束与不起作用的约束
    (2)GP型问题的一阶必要条件(IP和EP可以看做GP的特殊情况)
    一阶必要条件
    λ i g i ( X ) = 0 巧妙地体现了只考虑起作用的约束。
    (3)Kuhn-Tucker条件
    k-T条件
  • 二阶充分条件
    1
    事实上我们遇到的函数基本没法这样去验证。

猜你喜欢

转载自blog.csdn.net/qq_41679006/article/details/80938495