谷歌機器學習速成課程筆記 13(Regularization for Sparsity-稀疏性正則化)

特徵組合很實用但也有一些問題,尤其是將稀疏特徵組合起來的時候。 (接上圖)那麼我們可能會遇到數百萬個可能存在的字詞和數百萬個可能存在的視頻,這些內容一旦組合起來,便會產生大量的係數,這就意味着,模型會突然增大從而佔滿內存,還可能減緩運行時間。 並且,儘管我們擁有大量的訓練數據,但其中仍有許多組合會非常罕見,因此我們最終可能會得到一些噪聲係數,並可能產生過擬合。如果產生過擬合,就要進行正則化。 現在
相關文章
相關標籤/搜索