李飛飛計算機視覺筆記(4)--神經網絡訓練細節part1

這裏說明一下,因爲這個視頻是2016年的,可能現在有些東西已經變化。 我們將用到以下和方差相關的定理: 假設有隨機變量x和w,它們都服從均值爲0,方差爲σ的分佈,且獨立同分布,那麼: • w*x就會服從均值爲0,方差爲σ*σ的分佈 • w*x+w*x就會服從均值爲0,方差爲2*σ*σ的分佈 是否我們應該需要大量的數據集對模型進行訓練? 這種認識是錯誤的,我們一般很少直接對卷積神經網絡進行訓練,通常
相關文章
相關標籤/搜索