深度學習數學基礎(二)之神經網絡構造

時間 2020-02-09

標籤深度學習數學基礎神經網絡構造欄目應用數學简体版

原文原文鏈接

如下有部分公式，若是沒法顯示，請訪問原文連接

書接上文，繼續說說神經網絡的結構。首先咱們要回顧上一篇文章深度學習數學基礎(一)之神經元構造中講到的兩個公式。算法

加權輸入公式

$$z=w_1x_1+w_2x_2+w_3x_3+...+b $$segmentfault

激活公式

$$y=a(z)$$網絡

還有神經元構造圖：
函數

咱們只要將這樣的神經元鏈接成網絡狀，那麼就造成了神經網絡。這裏咱們主要說最基礎的階層型神經網絡,像卷積神經網絡,循環神經網絡等須要學習完本系列後再進行學習。post

那麼咱們先來通俗的比喻下神經網絡用來幹什麼的，咱們以往在寫程序的時候都是求結果，而神經網絡求得卻不是結果，而是公式或規則（比喻），其實神經網絡就是經過大量的計算來不斷的減少偏差來求距離正解最類似的公式的權重和偏置等（統稱參數）。因此感受神經網絡高大上的朋友們不要有感受本身學不會的想法，其實神經網絡並不難，就是一個又一個的公式組合起來而已，不一樣的算法其實就是各個大佬用數學建模，咱們不看那麼遠，先跟我一塊兒把神經網絡的基礎入門一下吧。學習

1 神經網絡

下面就是一個階層型的神經網絡的圖片，按照層對該神經網絡劃分，可分爲輸入層,隱藏層(也稱爲中間層),輸出層。優化

2 神經網絡層級的職責

下面咱們說說神經網絡中各層的職責：spa

輸入層：該層負責讀取神經網絡須要的數據，這個層的神經元沒有輸入監聽，他們的輸出是將讀取的數據原樣輸出。輸入==輸出
隱藏層：該層神經元則負責上面咱們所回顧的兩個公式的計算操做，在神經網絡中，這層是實際處理信息的部分。計算z和y
輸出層：該層與隱藏層同樣，執行兩個公式的計算，而且顯示神經網絡的計算結果，也就是最終輸出。計算z和y並顯示結果

下圖是一個最簡單的神經網絡示例，用於咱們來理解神經網絡的本質。這個簡單的神經網絡的特徵是，前一層的神經單與下一層的全部神經元都有箭頭鏈接，這樣的層構造稱爲全鏈接層（fully connected layer）
翻譯

輸入層：輸入與輸出是相同的，若是必定要引入激活函數，那激活函數就是恆等函數$a(z)=z$，該示例中輸入層有12個神經元，對應圖片的12個像素數據3d

隱藏層：輸入是變量，根據對應的權重和偏置來計算z，再經由激活函數計算，輸出值傳遞到下一層

輸出層：該層有兩個神經元，分別對應着要識別的數字0和1，兩個神經元分別是對兩個輸出值較爲興奮的神經元，經過sigmoid咱們能夠拿到兩個神經元對數據的興奮度，經過對連個興奮度作比較，咱們就能夠來猜這個數據究竟是什麼了!

3 神經網絡的結構

3.1 示例說明

咱們還使用上方的示例來進行說明

創建一個神經網絡，用來識別經過 4×3 像素的圖像讀取的手寫數字 0 和 1。學習數據是 64 張圖像，其中像素是單色二值。

模式識別的難點在於答案不標準，這個例題也體現了這樣的特性。即便是區區一個 4×3 像素的二值圖像，所讀入的手寫數字0 和 1 的像素模式也是多種多樣的。例如，上方圖像能夠認爲是讀入了手寫數字 0。對於這樣的數字 0，即便人能設法識別出來，讓計算機來判斷也十分困難。下面讓咱們使用一個小故事來了解下如何使用神經網絡來解決這個問題。

假設有個神經網絡，輸入層12個神經元小弟，隱藏層住着3個神經元中層幹部，頂層住着2個神經元大哥，

底層輸入層的12個小弟接到任務要監控圖片的動靜，因此12個輸入層小弟分別住在4x3像素的圖像的各個像素上對圖片進行監控，若是像素信號是白色0，小弟就睡覺無論，若是像素是黑色1，小弟就興奮向上層通風報信，將他們的信息傳遞個他們的領導A、B、C

住在隱藏層的3箇中層幹部ABC分別重視下面三個地方，從下面的小弟那裏拿到信息，而後自身對信息的思考（計算z和y），看看有沒有須要本身注意的地方，把本身的想法跟頂層的兩個大哥彙報

住在最頂層輸出層的大哥拿到下面三個幹部遞交的信息，與三個幹部同樣，也進行了思考做出了對應的策略，而後兩個大哥看了下各自的策略，選出更好的那一個(興奮度高的)做爲了此次行動的策略。

讓咱們再來回顧下上面說到的隱藏層，3箇中層幹部分別重視三個模式，因此3箇中層幹部對12個手下各有偏心，好比A幹部就看重小弟4和7，B幹部看重小弟5和8，C幹部看中小弟6和9。

因此這幾個幹部有點偏愛，着重看了直接小弟給的情報，因此他們之間傳遞的興奮度的管道也變粗了。

而住在頂層的大哥對中層的幹部也各有偏心，好比大哥0喜歡幹部A和C，大哥1喜歡幹部B

那麼，咱們讀入手寫數字0，下面的小弟四、七、六、9看到這個圖就特別興奮了

興奮的小弟4和7向幹部A傳遞消息，興奮的小弟6和9向幹部C傳遞了消息，沒人向幹部B傳遞消息。

幹部A和C也接到了小弟傳來的信息也興奮了起來，因而幹部A和C也向上層向大哥0發送信息，而幹部B因爲沒有掌握到信息，就沒有向大哥1發送消息。

因爲大哥0是興奮地，而大哥1是冷靜的，根據以前說的大哥0的興奮度比大哥1高，因此就判斷這個圖片是0

3.2 偏置

在上面的示例中，下層的興奮度會或多或少的向上層傳遞，可是除了幹部看中小弟和大哥看中幹部的關係而傳送的興奮度外，還遺漏了一些信息，這個信息就是」噪音「，若是這些噪聲迷住了每一個人的腦子，就會致使沒法正確的傳遞興奮度信息，隱藏咱們須要減小噪音的功能，也就是咱們所說的偏置，將偏置放在每一個人（神經元）的心中，用來忽略少許的噪音，這個心中的偏置，就是各我的固有的個性。