python數據分析 | 多種方式獲取pandas.DataFrame數據對象

相關擴展庫
1# -*- coding: UTF-8 -*-
2
3# 導入擴展庫
4
5import pandas as pd
6
7import numpy as np
建立空DataFrame對象
1# 自定義列名建立空的DataFrame數據對象
2
3df = pd.DataFrame(columns={"name": "", "age": "", "sex": "", "score": "", "rate": ""})
4
5print(df)
6
7# Empty DataFrame
8# Columns: [name, age, sex, score, rate]
9# Index: []
數組建立DataFrame對象
1# 自定義數組建立DataFrame對象
 2
 3list_data = [['1', '2', '3']]
 4
 5df = pd.DataFrame(list_data, columns=['first', 'second', 'third'])
 6
 7print(df)
 8
 9#   first second third
10# 0     1      2     3
字典建立DataFrame對象
1# 自定義字典類型的數據建立DataFarme對象
 2
 3data_dict = {'first_col': [1, 2, 3, 4], 'second_col': [5, 6, 7, 8]}
 4
 5df = pd.DataFrame(data_dict)
 6
 7print(df)
 8
 9#    first_row  second_row
10# 0          1           5
11# 1          2           6
12# 2          3           7
13# 3          4           8
文件返回DataFrame對象
1# 讀取數據文件返回DataFrame對象
2
3df=pd.read_csv('/usr/load/data.csv',split=',')
4
5df=pd.read_csv('/usr/load/data.xls',sheet_name='data')
6
7print(df)
np建立DataFrame對象
1# 使用numpy科學計算庫提供的二維數組建立DataFrame對象
 2
 3data_array = np.random.rand(4, 2)
 4
 5df = pd.DataFrame(data_array, columns=['first', 'second'])
 6
 7print(df)
 8
 9#       first    second
10# 0  0.410413  0.510788
11# 1  0.726956  0.647775
12# 2  0.502573  0.226714
13# 3  0.926117  0.124414

更多精彩前往微信公衆號【Python 集中營】,專一於 python 技術棧,資料獲取、交流社區、乾貨分享,期待你的加入~python

在這裏插入圖片描述

相關文章
相關標籤/搜索