【機器學習】好想徹底搞明白L1/L2正則

1.L1/L2的先驗 2.爲什麼L1正則會使得參數稀疏,而L2不會? 3.如何求解Lasso?次梯度問題 4.從數學角度解釋爲什麼L2正則可以提升模型的泛化能力? 1.L1/L2的先驗 說到先驗的概念就不得不提到貝葉斯理論的概念,由於現在大家都是提倡大數據的時代,而數據量越大,貝葉斯理論中先驗的力量就會越小,但是實際上大多數模型中,尤其是今天我們說的正則化中都有着貝葉斯理論的影子。 但是貝葉斯理論
相關文章
相關標籤/搜索