「機器學習」到底需要多少數據?

本文首發於微調的知乎專欄「數據說」。 機器學習中最值得問的一個問題是,到底需要多少數據纔可以得到一個較好的模型?從理論角度,有Probably approximately correct (PAC) learning theory來描述在何種情況下,可以得到一個近似正確的模型。但從實用角度看,PAC的使用範圍還是比較侷限的。所以今天我們主要想討論一個問題:到底如何定義有效數據量。 1. 數據的粒度
相關文章
相關標籤/搜索