import pandas as pd path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv' def opendata(path): df = pd.read_csv(path) list_label = df.columns.values #cloumns 爲csv文件的標題 print(df) print(list_label) opendata(path)
import pandasas pd data = pd.read_csv(path,nrows =5) print(data)
將csv文件轉化爲list
數組
import pandas as pd path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv' def opendata(path): df = pd.read_csv(path) list_label = df.columns.values list_data =df.values.tolist() print(list_data) opendata(path) #[['青年', '否', '否', '通常', '否'],
['青年', '否', '否', '好', '否'],
['青年', '是', '否', '好', '是'],
['青年', '是', '是', '通常', '是'],
['青年', '否', '否', '通常', '否'],
['中年', '否', '否', '通常', '否'],
['中年', '否', '否', '好', '否'],
['中年', '是', '是', '好', '是'],
['中年', '否', '是', '很是好', '是'],
['中年', '否', '是', '很是好', '是'],
['老年', '否', '是', '很是好', '是'],
['老年', '否', '是', '好', '是'],
['老年', '是', '否', '好', '是'],
['老年', '是', '否', '很是好', '是'],
['老年', '否', '否', '通常', '否']]
方法一:直接del DF['column-name']spa
方法二:採用drop方法,有下面三種等價的表達式:code
1. DF= DF.drop('column_name', 1);blog
2. DF.drop('column_name',axis=1, inplace=True)內存
3. DF.drop([DF.columns[[0,1, 3]]], axis=1,inplace=True) # Note: zero indexedpandas
import pandas as pd path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv' def opendata(path): df = pd.read_csv(path) df_delete = df.drop('類別',1)#刪除類別這一列 list_label = df.columns.values list_data =df_delete.values.tolist() print(list_data) return list_label,list_data opendata(path)
ps:凡是會對原數組做出修改並返回一個新數組的,每每都有一個 inplace可選參數。若是手動設定爲True(默認爲False),那麼原數組直接就被替換。也就是說,採用inplace=True以後,原數組名(如2和3狀況所示)對應的內存值直接改變;而採用inplace=False以後,原數組名對應的內存值並不改變,須要將新的結果賦給一個新的數組或者覆蓋原數組的內存位置(如1狀況所示)。class