基本概念
本文将讨论下类形状的优化问题
x∈Rnminf(x)s.t. h(x)=0
其中
- x∈Rn,
- f:Rn→R,
- h:Rn→Rm,h=[h1,...,hm]T,m≤n。
假定函数 h 连续可微,即 h∈C1。
正则点
设点 x∗ 满足约束条件
h1(x∗)=0,…,hm(x∗)=0,
如果梯度向量 ∇h1(x∗),…,∇hm(x∗) 线性无关,则称 x∗ 是该约束的一个 正则点。
切线空间
曲面
S={x∈Rn:h(x)=0}
在点 x∗ 处的切线空间为
T(x∗)={y∈Rn:Dh(x∗)y=0}.
可见切线空间 T(x∗) 就是矩阵 Dh(x∗) 的零空间:
T(x∗)=N(Dh(x∗)).
法线空间
曲面
S={x∈Rn:h(x)=0}
在点 x∗ 处的法线空间为
N(x∗)={Dh(x∗)Tz:z∈Rm}.
因此,法线空间是矩阵 Dh(x∗)T 的值域:
N(x∗)=R(Dh(x∗)T).
拉格朗日条件
首先考虑只包含两个决策变量和一个等式约束的优化问题。令h:R2→R为约束函数,可知函数定义域中x处的梯度∇h(x)与通过该点的h(x)水平集正交,选择点x∗=[x1∗,x1∗]T使得h(x∗)=0,且∇h(x∗)=0,经过点x∗的水平集为集合{x:h(x)=0}。可利用曲线x(t)在x∗领域内进行参数化,x(t)是一个连续可微的向量函数h:R→R2:
x(t)=[x1(t),x1(t)]T,t∈(a,b),x∗=x(t∗),x˙(t∗)=0,t∗∈(a,b)
接下来可以证明,∇h(x∗)与x˙(t∗)正交。由于h在曲线{x(t):t∈(a,b)}上是常数 0,即对于所有的t∈(a,b)都有
h(x(t))=0
因此对于任意的t∈(a,b)都有
dtdh(x(t))=0
利用链式法则可以得到
dtdh(x(t))=∇h(x(t))Tx˙(t)=0
因此∇h(x∗)和x˙(t∗)正交
当x∗是f:R→R2在满足h(x)=0上的极小点的时候,可以证明,∇f(x∗)与x˙(t∗)正交,构造关于t的复合函数:
ϕ(t)=f(x(t))
当t=t∗的时候取得极小值,根据无约束极值问题的一阶必要条件可知
dtdϕ(t∗)=0
利用链式法则可以得到
dtdϕ(t∗)=∇f(x(t∗))Tx˙(t∗)=∇f(x∗)Tx˙(t∗)=0
因此,∇f(x∗)和x˙(t∗)正交,上面已经证明∇f(x∗)与x˙(t∗)正交,那么向量∇f(x∗)和∇h(x∗)平行,那么可以得到这种情况下的拉格朗日定理:
n=2,m=3 时的拉格朗日定理: 设点x∗是函数f:R2→R的一个极小点,约束条件是h(x)=0,h:R2→R,那么∇f(x∗)和∇h(x∗)平行,即如果∇h(x∗)=0,则存在标量λ∗,使得
∇f(x∗)+λ∗∇h(x∗)=0
其中λ∗为拉格朗日乘子。
将这个定理推广到一般情况下,即f:Rn→R,h:Rn→Rm,m≤n的时候,可以得到:
拉格朗日定理: x∗是f:Rn→R的局部极小点(或极大点),约束条件为h(x)=0,h:Rn→Rm,m≤n。如果x∗是正则点,那么存在λ∗∈Rm使得
Df(x∗)+λ∗TDh(x∗)=0
二阶条件
二阶必要条件: 设x∗是f:Rn→R在约束条件h(x)=0,h:Rn→Rm,m≤n,f,h∈C2下的局部极小点。如果x∗是正则点,那么存在λ∗∈Rm使得
1.Df(x∗)+λ∗TDh(x∗)=0T 2.对于所有的y∈T(x∗),都有yTL(x∗,λ∗)y≥0
二阶充分条件: 函数f,h∈C2,如果存在点x∗∈Rn和λ∗∈Rm,使得
1.Df(x∗)+λ∗TDh(x∗)=0T 2.对于所有的y∈T(x∗),都有yTL(x∗,λ∗)y>0
那么x∗是f在约束条件h(x)=0下的严格局部极小点
本文介绍了等式约束下的拉格朗日乘子法,后面还将会介绍不等式约束下的拉格朗日乘子法以及 KKT 条件等