1.6模型的比較和檢驗

在選擇合適的評估方法和相應的性能度量時,計算出性能度量後直接進行比較,會存在以下問題: 模型評估得到的是測試集上的性能,並非嚴格意義上的泛化性能,兩者並不完全相同 測試集上的性能與樣本選取關係很大,不同的劃分,測試結果會不同,比較缺乏穩定性 很多模型本身有隨機性,即使參數和數據集相同,其運行結果也可能存在差異 上述問題按照統計學的知識描述爲:已知兩個模型 f1和f2 ,兩者的泛化性能在測試集上的表
相關文章
相關標籤/搜索