拉格朗日對偶性

時間 2020-06-03

標籤拉格朗日對偶性简体版

原文原文鏈接

　　在約束最優化問題中，經常使用拉格朗日對偶性將原始問題轉換爲對偶問題求解。函數

廣義拉格朗日函數

　　稱最優化問題優化

$\begin{equation} \begin{array}{lcl} \min\limits_{x\in R^n} f(x)\\ \begin{aligned} \text{s.t.}\;\;&c_i(x) \le 0,\;\;i=1,2,...,k \\ &h_j(x)=0,\;\;j=1,2,...,l \end{aligned} \end{array} \end {equation}$blog

　　爲原始最優化問題。使用以上優化問題構造廣義拉格朗日函數：it

$L(x,\alpha,\beta) = f(x)+\sum\limits_{i=1}^k\alpha_ic_i(x)+\sum\limits_{j=1}^l\beta_jh_j(x)$io

　　其中$\alpha_i\ge 0,\beta_j\in R$是拉格朗日乘子。能夠發現，對於違反原始問題約束的$x$，即存在某個$c_i(x)>0$，或某個$h_j(x)\ne 0$，有：im

$\max\limits_{\alpha\ge 0,\beta}L(x,\alpha,\beta) = +\infty$margin

　　所以有：img

$\begin{equation} \max\limits_{\alpha\ge 0, \beta}L(x,\alpha,\beta) = \left\{ \begin{aligned} &f(x),\;\;x知足原始條件約束\\ &+\infty,\;\;else \end{aligned} \right. \end {equation}$di

　　所以原始問題的最優值能夠表示爲：co

$p^* = \min\limits_{x}\max\limits_{\alpha\ge 0 , \beta}L(x,\alpha,\beta)$

　　從而將約束條件與待優化問題結合到了一塊兒，稱爲廣義拉格朗日函數的極小極大問題。

對偶問題以及KKT條件

對偶問題

　　將極小極大交換一下，獲得

$d^* = \max\limits_{\alpha\ge 0 , \beta}\min\limits_{x}L(x,\alpha,\beta)$

　　即爲原始問題的對偶問題的最優值。對偶問題轉換爲帶條件的形式就是：

$\begin{aligned} &\max\limits_{\alpha,\beta}\min\limits_{x} L(x,\alpha,\beta)\\ &\;\text{s.t.}\;\;\alpha_i\ge 0, \;\; i=1,2,...,k \\ \end{aligned}$

　　若是原始問題與對偶問題都有最優值，$p^*$和$d^*$，則：

$d^*= \max\limits_{\alpha\ge 0 , \beta}\min\limits_{x}L(x,\alpha,\beta)\le \min\limits_{x}\max\limits_{\alpha\ge 0 , \beta}L(x,\alpha,\beta)= p^*$

　　這是由於，對於任意$x,\alpha,\beta$，有：

$\min\limits_{x}L(x,\alpha,\beta)\le L(x,\alpha,\beta)\le\max\limits_{\alpha\ge 0 , \beta}L(x,\alpha,\beta)$

　　也就是左邊關於$\alpha,\beta$的函數，老是小於等於右邊關於$x$的函數。因此有$d^*\le p^*$。

KKT條件

　　某些狀況下，對偶問題與原始問題有相等的最優值，即對於一樣的$x^*,\alpha^*,\beta^*$，有$d^* = p^*$，這時解對偶問題能夠替代原始問題，條件以下：

　　一、$f(x)$和$c_i(x)$是凸函數；

　　二、$h_j(x)$是仿射函數，即一次函數；

　　三、不等式約束$c_i(x)$是嚴格可行的，即存在$x$，對全部$i$有$c_i(x)<0$。若是不存在這樣的$x$的話，實際上就是等式約束了。這是由於，每一個$x$都會使某個不等式約束取等號，也就能夠僅使用等式約束來表示這些$x$了。

　　此時有：

$p^*=d^*=L(x^*,\alpha^*,\beta^*)$

　　且算出$x^*,\alpha^*,\beta^*$的充要條件是（KKT條件）：

$\left\{ \begin{aligned} &\nabla_xL(x^*,\alpha^*,\beta^*) = 0 \\ &\alpha_i^*c_i(x^*) = 0, \;\; i=1,2,...,k \\ &c_i(x^*) \le 0, \;\; i=1,2,...,k \\ &\alpha_i^*\ge 0, \;\; i=1,2,...,k \\ &h_j(x^*) = 0, \;\; i=1,2,...,l \\ \end{aligned} \right.$