機器學習

結構=特徵值+目標值spa

數據降維:code

import pandas as pd from sklearn.decomposition import PCA #讀取表格數據
prior=pd.read_csv('./data/order_products__prior.csv') products=pd.read_csv('./data/products.csv') orders=pd.read_csv('./data/orders.csv') aisles=pd.read_csv('./data/aisles.csv') _mg=pd.merge(prior,products,on=['product_id','product_id']) _mg=pd.merge(_mg,orders,on=['order_id','order_id']) mt=pd.merge(_mg,aisles,on=['aisle_id','aisle_id']) mt.head(5) #四張表拼接成一張表

#處理分段數據 全部用戶 購買的所有商品一覽表
cross=pd.crosstab(mt['user_id'],mt['aisle']) cross.head(5) pca=PCA(n_components=0.9) #數據降維 保存百分之90的有用數據
 data=pca.fit_transform(cross) data.shape
相關文章
相關標籤/搜索