最優化

我們上一篇文章中得到了損失函數值,我們要根據這個損失值來調參數,那麼怎麼將參數調成一個最優的?,這就是最優化問題。 我們知道損失函數值越大表明分類效果越差,損失函數值越小表明分類效果越好,所以這裏我們就需要將損失函數值減小到一個最小的範圍。 首先介紹一下梯度的概率: 梯度(一階導數) 考慮一座在 (x1, x2) 點高度是 f(x1, x2) 的山。那麼,某一點的梯度方向是在該點坡度最陡的方向,而
相關文章
相關標籤/搜索