Python數據分析幾個比較經常使用的方法

1,表頭或是excel的索引若是是中文的話,輸出會出錯

​​解決方法:python的版本問題!換成python3就自動解決了!固然也有其餘的方法,這裏就再也不深究html

2,若是有不少列,如何輸出指定的列?

需求狀況:有的時候,數據不少,可是隻要僅僅對部分列的數據進行分析的話,要怎麼作?python

解決方法app

df = pandas.read_excel('1.xls',sheetname= '店鋪分析日報')url

​df = df.loc[:,['關鍵詞','帶來的訪客數','跳失率']] #訪問指定的列spa

一行讀取數據,第二行訪問指定列.net

3,如何爲數據框添加新的列?

需求狀況:有一個表格,裏面的列是單價,數量,想再輸出一個總價的列,或是對一些數據進行總結excel

解決方法:直接上代碼orm

from pandas import read_csv;htm

import pandas;blog

df = read_csv("1.csv", sep="|");

#把計算結果添加爲一個新的列

df['result'] = df.price*df.num     #新的列名,後面是對應的數值

print (df)

4,如何對百分號的數值進行計算,再將其輸出

需求狀況:比較蛋疼的一個狀況,電商不少數據都是百分比的,帶有百分號,不能進行直接的計算,須要對其進行轉換,而後再輸出

解決方法:

from pandas import read_csv;

import pandas;

df = read_csv("1.csv", sep="|");

f = df['跳失率'].str.strip("%").astype(float)/100;

f.round(decimals=2)  #保留小數點後面2位

f_str = f.apply(lambda x: format(x, '.2%'));  #再轉換成百分號而且保留2位數(精度能夠調整)

df['跳失率']​ = f_str     #從新賦值

5,​如何獲取導入的數據有幾行和幾列(數值)

需求狀況:有的時候須要寫一個通用腳本,好比隨機抽樣分析,程序自動獲取行和列的話,寫出來的腳本通用性明顯會很強

解決方法:

df.columns.size   #獲取列數

df.iloc[:, 0].size  #獲取行數

6,​如何對數據進行排序

需求狀況:這個就不用說了,處處都要用到​

解決方法:

df['跳失率'].size   #對數據進行排序

newDF = df.sort(['曝光量', '帶來的訪客數'], ascending=[True, False]);  #多重排序

7,如何刪除指定的列?

需求狀況:一樣,十幾列的數據,若是你想獲取指定的輸出數據,能夠用方法2,可是若是想要獲取的數據列比較多,只有1-2行不想要,這樣就能夠用指定刪除列的方法了

解決方法:

df.columns.delete(1)​

一行代碼搞定!​

總結:總體來講的,python的語法在作數據分析仍是至關簡單的,不少的需求基本上就是一行代碼搞定!

8,如何添加整行數據?

df.append([1,2,34,,5])

相關文章
相關標籤/搜索