Machine Learning:Computing Parameters Analytically

Normal Equation 梯度下降提供了一種最小化J的方法。現在我們要討論第二種方法,這是一種顯式地執行最小化而不借助迭代的算法。 在正規方程中,我們將通過明確地針對J取導數並將其置爲0,這使我們無需迭代即可找到最佳θ θ = ( X T X ) − 1 X T y θ=(X^{T}X)^{-1}X^{T}y θ=(XTX)−1XTy 正規方程不需要進行特徵縮放 梯度下降和正規方程的比較 梯
相關文章
相關標籤/搜索