神經網絡與深度學習筆記(一)梯度下降算法

1、定義一個代價函數 w 表示所有的網絡中權重的集合 n 是訓練輸入數據的個數 a 是表 示當輸入爲 x 時輸出的向量 求和則是在總的訓練輸入 x 上進行的 C 稱爲二次代價函數;有時也稱被稱爲均方誤差或者 MSE 2、C 我們訓練神經網絡的目的是找到能最小化二次代價函數 C(w, b) 的權重和偏置 假設我們要最小化某些函數,C(v)。它可以是任意的多元實值函數,v = v1, v2, …。 注
相關文章
相關標籤/搜索