[斯坦福大學2014機器學習教程筆記]第二章-梯度降低

時間 2020-03-30

標籤斯坦福大學機器學習教程筆記第二梯度降低简体版

原文原文鏈接

以前咱們已經講了代價函數了，這節咱們講代價函數J最小化的梯度降低法。web

梯度降低是很經常使用的算法。它不只被用在線性迴歸上，還被普遍應用於機器學習的衆多領域。算法

下面是問題概述。咱們有一個函數J(θ₀,θ₁)，這也許是個線性迴歸的代價函數，也許是個須要最小化的其餘函數。咱們須要用一個算法，來最小化函數J(θ₀,θ₁)。機器學習

實際上，梯度降低算法能夠應用於更通常的函數，如J(θ₀,θ₁,θ₂,......θ_n)，你但願能夠在θ₀到θ_n之上最小化此函數。可是爲了簡化，咱們這裏只用θ₀,θ₁兩個參數。函數

梯度降低算法的基本思想是：首先給定θ₀和θ₁初始值（其實給定多少都不重要），但一般都設θ₀=0，θ₁=0。而後，咱們不停地一點點地改變θ₀和θ₁，來使J(θ₀,θ₁)變小。直到咱們找到J的最小值或者局部最小值。學習

下面咱們經過圖片來直觀地看一下它是怎麼工做的。spa

首先咱們先從θ₀和θ₁的某個值出發。想象一下你正站立在山的這一點上，站立在你想象的公園這座紅色山上，在梯度降低算法中，咱們要作的就是旋轉360度，看看咱們的周圍，並問本身要在某個方向上，用小碎步儘快下山。這些小碎步須要朝什麼方向？若是咱們站在山坡上的這一點，你看一下週圍，你會發現最佳的下山方向，你再看看周圍，而後再一次想一想，我應該從什麼方向邁着小碎步下山？而後你按照本身的判斷又邁出一步，重複上面的步驟，從這個新的點，你環顧四周，並決定從什麼方向將會最快下山，而後又邁進了一小步，並依此類推，直到你接近局部最低點的位置。咱們在剛剛出發點右邊再出發一次，這時咱們獲得另一個局部最低點的位置。orm