Python自動化之Excel去除相同數據

以前分享了一篇關於 Python的Excel合併的文章。連接在下方,今天爲你們分享一個 Python去除Excel中相同數據 也是以一個 工資表爲例。爲方便觀賞,數據量少,足夠使用。

致力打造口中:別人的公衆號
文中代碼的演示效果以及源碼獲取請點這裏spa

素材準備

一個帶有重複數據的Excel工資表excel

在這裏插入圖片描述

  • 安裝下載模塊(numpy pandasxlrd
  • 選擇正確的路徑(工資表路徑
  • 寫代碼

能夠看到,數據中有王一是有兩列code

如何篩選數據

這次經過手機號來篩選數據
名字可能相同,工資等也有可能相同
可是手機號是惟一
在這裏插入圖片描述blog

代碼分享

#去除重複數據
import pandas as pd # pip3 install pandas
import numpy as np # pip3 install numpy
import xlrd # pip install xlrd

labelName_phone = '手機號'
file_name = "2月份工資表"

frame = pd.read_excel('assets/'+file_name+'.xlsx')
data = pd.DataFrame(frame)
data.drop_duplicates([labelName_phone], keep='last', inplace=True)
data.to_excel('assets/'+file_name+'去重數據.xlsx')
print('完成')

效果展現

在這裏插入圖片描述

代碼成功運行之後,能夠看到文件夾內多了一個Excel表。
打開便可發現,裏面相同數據僅剩下一個。圖片

相關文章
相關標籤/搜索