ICML_2018學霸筆記2.1

2.1 深度學習的理論認識: (主講人:Sanjeev Arora) 專業術語: 深度網絡參數 分佈D的第ii次訓練 :損失函數 目標: 梯度下降: 要點:優化概念形成了深度學習 理論目標:通過競爭直覺的排序的定理,形成新的觀點和概念。新觀點的數學基礎。 演講概述: 優化:什麼時候/怎樣找到下降方案。尤其是非凸問題。 過度參數化/泛化:當參數遠大於訓練樣本時,還有效嗎?爲什麼網絡沒有泛化能力? 深
相關文章
相關標籤/搜索