Proximal Gradient Descent for L1 Regularization

時間 2019-12-12

標籤 proximal gradient descent l1 regularization 简体版

原文原文鏈接

[本文連接：http://www.cnblogs.com/breezedeus/p/3426757.html，轉載請註明出處]

假設咱們要求解如下的最小化問題：
\( \min\limits_x f(x) \) 。
若是\( f(x) \)可導，那麼一個簡單的方法是使用Gradient Descent (GD)方法，也即便用如下的式子進行迭代求解：
\( x_{k+1} := x_{k} - \alpha \nabla f(x_{k}) \) 。
對GD的一種解釋是\( x_{k} \)沿着當前目標函數的降低方向走一小段，只要步子足夠小，總能保證獲得 \( f(x_{k+1}) \leq f(x_{k}) \)。 html

若是\( \nabla f(x) \)知足L-Lipschitz，即：
\( ||\nabla f(x') - \nabla f(x)|| \leq L ||x’ - x|| \)，
那麼咱們能夠在點\( x_{k} \)附近把\( f(x) \)近似爲：
\( \hat{f}(x, x_k) \doteq f(x_k) + \langle \nabla f(x_k), x - x_k \rangle + \frac{L}{2} ||x - x_k||^2 \)。算法

把上面式子中各項從新排列下，能夠獲得：函數