機器學習:你需要多少訓練數據?

摘自:PPTV課堂 作者爲Google 軟件工程師,美國西北大學電子信息工程博士,擅長大規模分佈式系統,編譯器和數據庫。 從谷歌的機器學習代碼中得知,目前需要一萬億個訓練樣本 訓練數據的特性和數量是決定一個模型性能好壞的最主要因素。一旦你對一個模型輸入比較全面的訓練數據,通常針對這些訓練數據,模型也會產生相應的結果。但是,問題是你需要多少訓練數據合適呢?這恰恰取決於你正在執行的任務、最終想通過模型
相關文章
相關標籤/搜索