ICML_2018學霸筆記2.1

時間 2020-12-23

原文原文鏈接

2.1 深度學習的理論認識：（主講人：Sanjeev Arora）專業術語：深度網絡參數分佈D的第ii次訓練：損失函數目標：梯度下降：要點：優化概念形成了深度學習理論目標：通過競爭直覺的排序的定理，形成新的觀點和概念。新觀點的數學基礎。演講概述：優化：什麼時候/怎樣找到下降方案。尤其是非凸問題。過度參數化/泛化：當參數遠大於訓練樣本時，還有效嗎？爲什麼網絡沒有泛化能力？深

>>阅读原文<<