爲什麼L1稀疏L2平滑?

兩種解釋———————————— 1、從L1和L2的來源看 當你想從一個手頭的數據集中學習出一套規則時,貝葉斯學派認爲僅僅使用這些數據是不夠的,還需要加入先驗知識。如果你在損失函數中使用了L1正則項,那麼其實質就是加入了拉普拉斯先驗分佈,即認爲數據是符合拉普拉斯分佈的;如果你使用了L2正則項,那麼就是加入了高斯先驗分佈,即認爲數據是符合高斯分佈的。一般由於推導和計算方便,會對分佈函數取對數,然後再
相關文章
相關標籤/搜索