思考：線性規劃對偶與拉格朗日乘數法

時間 2020-05-15

標籤思考線性規劃對偶拉格朗日乘數欄目興趣愛好简体版

原文原文鏈接

拉格朗日乘數法和對偶線性規劃問題的聯繫

拉格朗日乘數法解題的基本思想

下面以一個二元函數爲例子解釋拉格朗日乘數法用於求解條件極值問題的思想。函數

咱們給定一個二元函數\(z\)：spa

\[z=f(x,y) \]

和一個約束條件：class

\[\varphi(x,y)=0 \]

爲了求解\(z=f(x,y)\)在附加條件下的極值，咱們先做出拉格朗日函數\(L(x,y,\lambda)\)，其定義以下：變量

\[L(x,y,\lambda)=f(x,y)+\lambda\varphi(x,y) \]

而後令\(L(x,y,\lambda)\)關於\(x,y,\lambda\)的一階偏導數分別等於0：lambda

\[\begin{aligned} \frac{\partial L}{\partial x}&=\frac{\partial f}{\partial x}+\lambda \frac{\partial \varphi}{\partial x}=0\\ \frac{\partial L}{\partial y}&=\frac{\partial f}{\partial y}+\lambda \frac{\partial \varphi}{\partial y}=0\\ \frac{\partial L}{\partial \lambda}&=\varphi (x,y)=0 \end{aligned} \]

求解知足上述方程組的\(x,y,\lambda\)，獲得的駐點\((x,y)\)，是\(z=f(x,y)\)在約束條件\(\varphi(x,y)=0\)限制下的可能的極值點。di

對偶線性規劃問題與拉格朗日乘數法

在這裏咱們給定一個通常的線性規劃問題\(P\)：display

\[\min z=c^TX\quad\\\begin{aligned}{\rm s.t.}\quad AX&\ge b\\X&\ge 0\end{aligned} \]

設:math

\[X=\left[\begin{matrix}x_1\\x_2\\ \vdots \\x_n\end{matrix}\right]\quad b=\left[\begin{matrix}b_1\\b_2\\ \vdots \\b_m\end{matrix}\right]\quad Y=\left[\begin{matrix}y_1\\y_2\\ \vdots \\y_m\end{matrix}\right]\quad \Lambda=\left[\begin{matrix}\lambda_1\\\lambda_2\\ \vdots \\\lambda_n\end{matrix}\right] \]

再令：ab

\[\overline{A}=\left[\begin{matrix}A\\I_{n}\end{matrix}\right]\quad\overline{b}=\left[\begin{matrix}b\\0\end{matrix}\right]\quad \overline{Y}=\left[\begin{matrix}Y\\\Lambda\end{matrix}\right] \]

咱們能夠做出它的拉格朗日函數：play

\[L(X,\overline Y)=c^TX-\overline Y^T(\overline AX-\overline b)=(c-\overline A^T\overline Y)^TX+\overline b^T\overline Y \]

這裏的乘子\(Y\ge 0,\Lambda\ge0\)，其梯度爲：

\[\nabla_XL(X,\overline Y)=c-\overline A^T\overline Y \]

極值點的梯度必定爲零，根據拉格朗日乘數法的求解思路，此時直接令梯度等於零，而後求解相應的變量值。接下來咱們求解問題\(D\)：

\[\max \ \ (c-\overline A^T\overline Y)^TX+\overline b^T\overline Y\\{\rm s.t.}\quad c-\overline A^T\overline Y=0 \]

因爲咱們已經令\(c-\overline A^T\overline Y=0\)，那麼問題\(D\)能夠化簡爲：

\[\max \ \ \overline b^T\overline Y\\\begin{aligned}{\rm s.t.}\quad c&=\overline A^T\overline Y\\\overline Y&\ge 0\end{aligned} \]

又由於：

\[\overline{A}=\left[\begin{matrix}A\\I_{n}\end{matrix}\right]\quad\overline{b}=\left[\begin{matrix}b\\0\end{matrix}\right]\quad \overline{Y}=\left[\begin{matrix}Y\\\Lambda\end{matrix}\right] \]

因此：

\[\overline b^T\overline Y=\left[\begin{matrix}b^T &0^T\end{matrix}\right]\left[\begin{matrix}Y\\\Lambda\end{matrix}\right]=b^TY\\\overline A^T\overline Y=\left[\begin{matrix}A^T &I_n\end{matrix}\right]\left[\begin{matrix}Y\\\Lambda\end{matrix}\right]=A^TY+\Lambda \]

因爲\(\Lambda\ge0\)，結合上式，問題\(D\)還能夠進一步化簡爲：

\[\max \ \ b^TY\\\begin{aligned}{\rm s.t.}\quad A^TY\le c\\Y\ge0\end{aligned} \]

這樣的問題\(D\)就稱爲原始線性規劃問題\(P\)的對偶問題。