深度學習基礎知識筆記

參數通過反向傳播(BP)求解 超參數是對網絡結構設計 而參數是反向傳播自動生成的最優解是與網絡結構並列的 其實用的就是一個線性迴歸,損失函數和梯度下降 對比 數學回憶 多位函數,分別對xyz求偏導,沿着導數方向進行調節最快 梯度下降 合適的步長很重要 對比之前知識 初始步長可以最大,0.01(收斂快) 過1w次後再變爲0.001 局部最優解:非凸——加入擾動因子 CD其實是最小
相關文章
相關標籤/搜索