以前分享了一篇關於Python的Excel合併的文章
。連接在下方,今天爲你們分享一個Python去除Excel中相同數據
也是以一個 工資表爲例。爲方便觀賞,數據量少,足夠使用。
致力打造口中:別人的公衆號
文中代碼的演示效果以及源碼獲取請點這裏spa
一個帶有重複數據的Excel工資表excel
numpy
、 pandas
、xlrd
)工資表路徑
)能夠看到,數據中有王一是有兩列code
這次經過手機號來篩選數據
名字可能相同,工資等也有可能相同
可是手機號是惟一
blog
#去除重複數據 import pandas as pd # pip3 install pandas import numpy as np # pip3 install numpy import xlrd # pip install xlrd labelName_phone = '手機號' file_name = "2月份工資表" frame = pd.read_excel('assets/'+file_name+'.xlsx') data = pd.DataFrame(frame) data.drop_duplicates([labelName_phone], keep='last', inplace=True) data.to_excel('assets/'+file_name+'去重數據.xlsx') print('完成')
代碼成功運行之後,能夠看到文件夾內多了一個Excel表。
打開便可發現,裏面相同數據僅剩下一個。圖片