機器學習筆記之大規模機器學習

時間 2020-12-27

原文原文鏈接

學習大數據集獲取高性能的機器學習系統途徑是採用低偏差的學習算法，並用大數據進行訓練。從下面的圖中可以明確，只要使用大數據對算法進行訓練，它的效果似乎會更好：從這樣的結果可以得出，在機器學習中，決定因素往往不是最好的算法而是誰的訓練數據最多。但是大數據集有它自己的特殊的問題，即計算問題。假設有一億個訓練樣本，想要訓練一個線性迴歸模型或一個邏輯迴歸模型，然後用梯度下降進行更新： θ j = θ

>>阅读原文<<