kaggle-EDA經驗

要構建數值型連續變量的監督學習模型,最重要的方面之一就是好好理解特徵。觀察一個模型的部分依賴圖有助於理解模型的輸出是如何隨着每個特徵變化而改變的。 但是繪製的圖形是基於訓練好的模型構建的,這會引發一些問題。而如果我們直接用未經學習的學習的訓練數據去作圖,我們就能更好理解這些數據的深層含義。因爲這樣做能幫助我們進行: 特徵理解 識別嘈雜特徵 特徵工程 特徵重要性 特徵調試 泄漏檢測與理解 模型監控
相關文章
相關標籤/搜索