Stanford機器學習---第四講. 神經網絡的表示 Neural Networks representation

時間 2019-12-08

標籤 stanford 機器學習第四神經網絡表示 neural networks representation 简体版

原文原文鏈接

原文 http://blog.csdn.net/abcjennifer/article/details/7749309網絡

本欄目（Machine learning）包括單參數的線性迴歸、多參數的線性迴歸、Octave Tutorial、Logistic Regression、Regularization、神經網絡、機器學習系統設計、SVM（Support Vector Machines 支持向量機）、聚類、降維、異常檢測、大規模機器學習等章節。全部內容均來自Standford公開課machine learning中Andrew老師的講解。（https://class.coursera.org/ml/class/index）機器學習

第四講——Neural Networks 神經網絡的表示函數

===============================學習

（一）、爲何引入神經網絡？——Nonlinear hypothesisspa

（二）、神經元與大腦（Neurons and Brain）.net

（三）、神經網絡的表示形式設計

（四）、怎樣用神經網絡實現邏輯表達式？blog

（五）、分類問題（Classification）get

本章主要圍繞神經網絡的建模及其線性表示（即neural networks的representation）作以初步瞭解，在下一章中將會有更詳細的神經網絡如何學習方面的知識。input

===============================

（一）、爲何引入神經網絡？——Nonlinear hypothesis

以前咱們討論的ML問題中，主要針對Regression作了分析，其中採用梯度降低法進行參數更新。然而其可行性基於假設參數很少，若是參數多起來了怎麼辦呢？好比下圖中這個例子：從100*100個pixels中選出全部XiXj做爲logistic regression的一個參數，那麼總共就有5*10^7個feature，即x有這麼多維。

因此引入了Nonlinear hypothesis，應對高維數據和非線性的hypothesis（以下圖所示）：

===============================

（二）、神經元與大腦（neurons and brain）

神經元工做模式：

神經網絡的邏輯單元：輸入向量x（input layer），中間層a(2,i)（hidden layer）, 輸出層h(x)（output layer）。

其中，中間層的a(2,i)中的2表示第二個級別（第一個級別是輸入層），i表示中間層的第幾個元素。或者能夠說，a(j,i) is the activation of unit i in layer j.

===============================

（三）、神經網絡的表示形式

從圖中可知，中間層a(2，j)是輸入層線性組合的sigmod值，輸出又是中間層線性組合的sigmod值。

下面咱們進行神經網絡參數計算的向量化：

令z⁽²⁾表示中間層，x表示輸入層，則有

，

z⁽²⁾=Θ⁽¹⁾x

a⁽²⁾=g(z⁽²⁾)

或者能夠將x表示成a⁽¹⁾，那麼對於輸入層a⁽¹⁾有[x_0~x_3]4個元素，中間層a⁽²⁾有[a⁽²⁾₀~a⁽²⁾₃]4個元素（其中令a⁽²⁾₀=1），則有

h(x)= a⁽³⁾=g(z⁽³⁾)

z⁽³⁾=Θ⁽²⁾a⁽²⁾

經過以上這種神經元的傳遞方式（input->activation->output）來計算h(x), 叫作Forward propagation, 向前傳遞。

這裏咱們能夠發現，其實神經網絡就像是logistic regression，只不過咱們把logistic regression中的輸入向量[x₁~x₃]變成了中間層的[a⁽²⁾₁~a⁽²⁾₃], 即

h(x)=g(Θ⁽²⁾₀ a⁽²⁾₀+Θ⁽²⁾₁ a⁽²⁾₁+Θ⁽²⁾₂ a⁽²⁾₂+Θ⁽²⁾₃ a⁽²⁾₃)

而中間層又由真正的輸入向量經過Θ⁽¹⁾學習而來，這裏呢，就解放了輸入層，換言之輸入層能夠是original input data的任何線性組合甚至是多項式組合如set x1*x2 as original x1...另外呢，具體怎樣利用中間層進行更新下面會更詳細地講；此外，還有一些其餘模型，好比：

===============================

（四）、怎樣用神經網絡實現邏輯表達式？

神經網路中，單層神經元（無中間層）的計算可用來表示邏輯運算，好比邏輯AND、邏輯或OR

舉例說明：邏輯與AND；下圖中左半部分是神經網絡的設計與output層表達式，右邊上部分是sigmod函數，下半部分是真值表。

給定神經網絡的權值就能夠根據真值表判斷該函數的做用。再給出一個邏輯或的例子，以下圖所示：

以上兩個例子只是單層傳遞，下面咱們再給出一個更復雜的例子，用來實現邏輯表達< x1 XNOR x2 >, 即邏輯同或關係，它由前面幾個例子共同實現：

將AND、NOT AND和 OR分別放在下圖中輸入層和輸出層的位置，便可獲得x1 XNOR x2，道理顯而易見：

a²₁ = x1 && x2

a²₂ = （﹁x1）&&（﹁x2）

a³₁ =a²₁||a²₁ =(x1 && x2) || （﹁x1）&&（﹁x2） = x1 XNOR x2；

應用：手寫識別系統

===============================

（五）、分類問題（Classification）

記得上一章中咱們講過的one-vs-all分類問題麼？one-vs-all方法是把二類分類問題到多類分類的一個推廣，在這裏，咱們就講述如何用神經網絡進行分類。網絡設計以下圖所示：

輸入向量x有三個維度，兩個中間層，輸出層4個神經元分別用來表示4類，也就是每個數據在輸出層都會出現[a b c d]^T，且a,b,c,d中僅有一個爲1，表示當前類。

===============================

小結

本章引入了ML中神經網絡的概念，主要講述瞭如何利用神經網絡的construction及如何進行邏輯表達function的構造，在下一章中咱們將針對神經網絡的學習過程進行更詳細的講述。

相關文章

相關標籤/搜索

計算機網絡學習

網站主機教程

瀏覽器信息

網站品質教程

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。

最新文章

本站公眾號

歡迎關注本站公眾號,獲取更多信息

相關文章

>>更多相關文章<<