1.導包html
2.提取數據spa
3.PCA降維3d
提取兩個主成分的累計貢獻率達到了0.9777,說明主成分的解釋效果較好。blog
當參數n_components中不填寫任何值時,默認返回min(X.shape)個特徵。通常來講,樣本量都會大於特徵數目,因此什麼都不填就至關於轉換了新特徵空間,但沒有減小特徵的個數。通常不會使用這種輸入⽅式。但咱們能夠使用這種⽅式來畫出累計可解釋⽅差貢獻率曲線,以此選擇最好的n_components取值。數據
從累計貢獻率曲線能夠看出提取兩個主成分的累計貢獻率達到0.9777,提取四個主成分的累計貢獻率爲0.9948,增長兩個主成分累計貢獻率只增長0.0171,但同時卻增長了模型複雜度,加大計算量,增長運行時間,因此提取二個主成分最爲合適。db
原文出處:https://www.cnblogs.com/lvzw/p/11655902.htmlimg