再聊神經網絡與深度學習

非線性的世界

咱們的世界是一個非線性的世界,咱們可否讓機器來學習現實中不少複雜的問題呢?從人類大腦結構中受到的啓發,人們開始在必定程度上模擬大腦的結構。既然大腦可以理解這個世界,那人工神經網絡應該也是能夠的。mysql

timg

神經網絡

簡單的感知機屬於線性模型,而經過嵌套多個神經網絡層和增長神經元就能夠解決不少複雜的問題。算法

整個神經網絡模型包含了三要素:線性變換、非線性變換和線性決策。線性與非線性變換實際上就是座標變換,將信息聚合到其餘空間中。從線性到非線性屬於特徵變換,將某種特徵轉成另一種特徵。而多層神經網絡就是作表徵學習。sql

從數學上看,神經網絡的嵌套就是多個函數嵌套,經過複雜的函數嵌套關係來描述特徵關係。網絡

image

學習複雜關係

現實中存在不少複雜關係的事物,因而須要構建複雜的邊界才能描述它們。那麼要怎麼來學習這些邊界呢?咱們能夠把每一個神經元當作一個簡單邊界描述,經過引入一個隱層,不少神經元就能描述很複雜的邊界,即取不少神經元邊界的交集。數據結構

timg (1)

超大淺層網絡

既然引入一個隱層就能描述任意複雜的連續邊界,那麼是否是咱們就能夠說對任何複雜關係都只須要使用淺層網絡就行呢?無論多複雜的關係,我增長神經元即是了,最終構建一個超大淺層網絡來描述任意複雜關係。併發

5af1a7960001ce5806000705

深度網絡

超大淺層網絡看似無敵,但它會引入維度災難。超大淺層網絡實際上是將低緯度的特徵表徵到超高維度空間中,這樣作將須要足夠大的數據量才能進行學習。除此以外,還將會致使過擬合問題。機器學習

因此能夠朝深度方向改進,將網絡拆成更多層數,這樣每一層都抽象不一樣的特徵,也就是每一層抽象的程度都不相同。越日後的信息越抽象,就像人類對信息的處理,越靠近感官的信息越具體。好比看到一本書,眼睛最初看到的是書名和書的大小顏色等信息。日後處理,可能思考的是這本書的主題之類的信息。函數

總的來講,咱們但願獲得一個低緯度卻能很好表示複雜關係的網絡。學習

timg (2)

-------------推薦閱讀------------.net

個人開源項目彙總(機器&深度學習、NLP、網絡IO、AIML、mysql協議、chatbot)

爲何寫《Tomcat內核設計剖析》

2018彙總數據結構算法篇

2018彙總機器學習篇

2018彙總Java深度篇

2018彙總天然語言處理篇

2018彙總深度學習篇

2018彙總JDK源碼篇

2018彙總Java併發核心篇

2018彙總讀書篇


跟我交流,向我提問:

歡迎關注:

相關文章
相關標籤/搜索