4.gradient descent

Gradient Descent 注意是列向量 做gradient descent的時候最好把右邊的圖畫出來,可以調整learning rate 另外一種,最簡單的就是Adagrad 假設有一個人平時很兇惡,而今天對我溫柔了,就會覺得他特別溫柔 除了一次微分,還要除以二次微分,才能真正衡量和最低點的距離,這和adgrad的聯繫在哪裏呢? 天下武功唯快不破
相關文章
相關標籤/搜索