【轉】基本概念:過擬合、修剪、假正、假負

    一般會把整個訓練集分紅兩個部分:拿數據的約 60-80 % 放入咱們的訓練集,用來生成模型;而後拿剩下的數據放入一個測試集,在模型生成後,當即用其來測試咱們模型的準確性。     那麼這個額外的步驟爲何在此模型中如此重要呢?這個問題就是所謂的過擬合:若是咱們提供過多 數據用於模型建立,咱們的模型雖然會被完美建立,但只針對的是該數據。請記住:咱們想使用此模型來預測將來的未知數;咱們不是想使用
相關文章
相關標籤/搜索