學習筆記-Large scale machine learning

終於來到了倒數第二週,這章的主要內容是怎樣應對超大樣本量的機器學習項目,例如訓練集有500萬個樣本。 之前我們曾提到,有時候樣本量的多少決定了一個模型的好壞,當樣本量達到一定數量級時,應用不同算法獲得的結果差不多。有句名言「最後獲勝的人往往是那些擁有最多數據量的人,而不是那些擁有最好算法的人」 當然不斷增多訓練樣本量不總是有效,我們需要有評價標準告訴我們在何種情況下,增大樣本量會帶來益處。對於下面
相關文章
相關標籤/搜索