反向傳播的直觀理解 (以及爲什麼反向傳播是一種快速的算法)

解釋:公式 46 其實就是微分的定義公式,」W + εej  」代表對於由 j 個 weight 構成的單位向量 W,在其他權重都不變的情況下,使得 Wj 微小的改變 ε(W爲單位向量,ej = 1,ε可正可負)。這個公式是向量形式。 解釋:計算一次網絡傳播需要1,00,001次說的是模型進行一次梯度下降,即更新一次所有權重。1,000,000個參數需要將網絡向前傳播 1,000,000 次來計算
相關文章
相關標籤/搜索