再談權重共享

以前在幾篇博客中說到了權重共享,但都以爲不夠全面,這裏作個專題,之後有新的理解都在此更新。網絡

 

1. 減小運算只是錦上添花學習

以前說到權重共享能夠減小運算,是的,但這樣說好像是無關緊要,只是運算量大小的問題,其實不是無關緊要的。博客

 

2. 權重共享的本質是特徵提取模板

以前說到權重就是模板,咱們按照必定的模板來與樣本進行比對,看看有沒有與模板一致的外在表現(特徵)class

 

3. 權重共享使得模型泛化神經網絡

普通的神經網絡輸入是固定的,而權重共享可使得輸入不固定。搜索

好比不少張圖像,每張圖像上有我的臉,可是人臉在圖像的不一樣位置,或者圖像的大小也不相同,此時權重共享能夠全圖掃描,搜索人臉,進而把特徵提取出來。di

再如RNN作語義分析,兩句話:我去年去了北京;去年我和父母去了北京,這其實意思差很少,但文字位置不一樣,句子長度也不一樣。co

 

權重共享使得模型可以處理一個連續序列的特徵,而無論輸入的序列總長度是多少。模型

當這個連續序列在樣本的不一樣位置時,依然可以識別,而不是學習每一個位置的規則,這不只抓住了不一樣特徵之間的連續性,也減小了學習規則

 

因此權重共享是必須的。

相關文章
相關標籤/搜索