Python3 讀取csv文件

時間 2019-11-21

標籤 python3 python 讀取 csv 文件欄目 Python 简体版

原文原文鏈接

使用pandas 讀取csv文件前幾行數據

文件內容以下：

先讀取標題：

import pandas as pd

path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv'
def opendata(path):
    df = pd.read_csv(path)
    list_label = df.columns.values   #cloumns 爲csv文件的標題
    print(df)
    print(list_label)
opendata(path)

讀取前幾行數據：

import pandasas pd
  
data = pd.read_csv(path,nrows =5)
print(data)

將csv文件轉化爲list
數組

import pandas as pd

path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv'
def opendata(path):
    df = pd.read_csv(path)
    list_label = df.columns.values 
    list_data =df.values.tolist()
    print(list_data)
opendata(path)


#[['青年', '否', '否', '通常', '否'], 
['青年', '否', '否', '好', '否'], 
['青年', '是', '否', '好', '是'], 
['青年', '是', '是', '通常', '是'], 
['青年', '否', '否', '通常', '否'], 
['中年', '否', '否', '通常', '否'], 
['中年', '否', '否', '好', '否'], 
['中年', '是', '是', '好', '是'], 
['中年', '否', '是', '很是好', '是'], 
['中年', '否', '是', '很是好', '是'], 
['老年', '否', '是', '很是好', '是'], 
['老年', '否', '是', '好', '是'], 
['老年', '是', '否', '好', '是'], 
['老年', '是', '否', '很是好', '是'], 
['老年', '否', '否', '通常', '否']]

刪除csv文件的某一列

方法一：直接del DF['column-name']spa

方法二：採用drop方法，有下面三種等價的表達式：code

1. DF= DF.drop('column_name', 1)；blog

2. DF.drop('column_name',axis=1, inplace=True)內存

3. DF.drop([DF.columns[[0,1, 3]]], axis=1,inplace=True) # Note: zero indexedpandas

import pandas as pd



path = r'C:\Users\dhw\Desktop\work\term paper\Home work_10\TREE.csv'
def opendata(path):
    df = pd.read_csv(path)
    df_delete = df.drop('類別',1)#刪除類別這一列
    list_label = df.columns.values    
    list_data =df_delete.values.tolist()
    print(list_data)
    return list_label,list_data
opendata(path)

ps:凡是會對原數組做出修改並返回一個新數組的，每每都有一個 inplace可選參數。若是手動設定爲True（默認爲False），那麼原數組直接就被替換。也就是說，採用inplace=True以後，原數組名（如2和3狀況所示）對應的內存值直接改變；而採用inplace=False以後，原數組名對應的內存值並不改變，須要將新的結果賦給一個新的數組或者覆蓋原數組的內存位置（如1狀況所示）。class

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。