ML:教你聚類並構建學習模型處理數據(附數據集)

本文將根據41個描述性分類特徵的維度,運用無監督主成分分析(PCA)和層次聚類方法對觀測進行分組。將數據聚類可以更好地用簡單的多元線性模型描述數據或者識別更適合其他模型的異常組。此方法被編寫在python類中,以便將來能實現類似網格搜索的參數優化。 結果與討論 本項目中,我們將機器學習技術應用於Ames住房數據集,用79個解釋變量來預測房屋的銷售價格,其中包括41個分類變量(分類型變量),38個連
相關文章
相關標籤/搜索