爲什麼L1稀疏L2平滑？

時間 2020-12-24

標籤機器學習 L1 L2 简体版

原文原文鏈接

兩種解釋———————————— 1、從L1和L2的來源看當你想從一個手頭的數據集中學習出一套規則時，貝葉斯學派認爲僅僅使用這些數據是不夠的，還需要加入先驗知識。如果你在損失函數中使用了L1正則項，那麼其實質就是加入了拉普拉斯先驗分佈，即認爲數據是符合拉普拉斯分佈的；如果你使用了L2正則項，那麼就是加入了高斯先驗分佈，即認爲數據是符合高斯分佈的。一般由於推導和計算方便，會對分佈函數取對數，然後再

>>阅读原文<<

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。