《Scala機器學習》一一1.4 基本抽樣、分層抽樣和一致抽樣

1.4 基本抽樣、分層抽樣和一致抽樣 相當多的數據分析人員蔑視採樣。通常要想處理整個數據集,只有改進模型。實際上,在這兩者之間進行權衡會很複雜。首先,可以在抽樣的數據集上建立更復雜的模型,特別是模型的時間複雜度是非線性(比如在大多數情況下至少是N* log(N))時更是如此。用更快的週期構建模型可讓用戶能更快地迭代模型,使其按最佳方式收斂。在很多情況下,若在整個數據集上建立模型,則在改進預測精度時
相關文章
相關標籤/搜索