相信有很多朋友平常工做會用到 Excel 處理各式表格文件,更有甚者可能要花大把時間來作繁瑣耗時的表格整理工做。最近有朋友問能否編程來減輕表格整理工做量,今兒咱們就經過實例來實現 Python 對錶格的自動化整理。php
首先咱們有這麼一份數據表 source.csv:python
咱們要作的是從上表中提取數據,來生成一份符合如下要求的表格:編程
按照如下分組名單 group.xls 來整理數據表中的數據:bash
最終要展示的數據項:網絡
其中「K數據/60」爲數據表中的「數據K」/60後保留的2位小數函數
咱們先看手工 Excel 如何處理以上需求:要在 source.csv 數據表中讀取讀取每條數據,放入 group.xls 匹配的分組成員中,最後篩選須要的數據項,再對特定的 「數據K」進行運算處理。工具
那麼 Python 又將如何操做呢?這裏咱們要用到功能強大的 pandas 庫。ui
pandas 是基於NumPy 的一種工具,該工具是爲了解決數據分析任務而建立的。Pandas 歸入了大量庫和一些標準的數據模型,提供了高效地操做大型數據集所需的工具。pandas提供了大量能使咱們快速便捷地處理數據的函數和方法。你很快就會發現,它是使Python成爲強大而高效的數據分析環境的重要因素之一。spa
pandas 百度百科.net
首先導入 pandas 庫,經過相關的函數讀取 csv 和 xls 表格內容:
import pandas as pd # 讀取 group.xls 分組信息 group = pd.read_excel("group.xls",header=None) group.columns=["分組","角色"] print(group) # 讀取 source.csv 獲取全部成員數據 source = pd.read_csv("source.csv") print(source)
咱們能夠首先對 source.csv 中的數據項進行篩選,須要的數據項有「角色」、「編號」、「數據B」、「數據C」、「數據D」和「數據K」:
# 經過 iloc[:,[列座標]] 來定位須要的各列數據 filter_merge = source.iloc[:,[0,2,4,5,6,13]] print(filter_merge)
接下來是根據分組角色來匹配角色數據,注意到 group.xls 和 source.csv 共有「角色」一項,咱們能夠經過此項將兩個表格融合從而造成匹配填充的效果。
combine = pd.merge(group,filter_merge,on="角色")
接下來咱們在第二列插入運算後的「數據K/60」:
combine.insert(1,"數據K/60",round(filter_merge["數據K"]/60,2))
最終,咱們將生成的數據格式寫入新的 xlsx 表格中:
combine.to_excel(excel_writer="result.xlsx",index=False)
最終自動生成的表格以下:
以上即是 Excel 表格整理的 Python 代碼簡單實現,在操做過程當中也遇到幾個問題貼在這裏供你們參考:
導入 pandas 時可能會報錯:
解決:根據報錯信息安裝須要的相關模塊
要進行表格整理的電腦爲公司電腦、沒法鏈接外網下載 Python
解決:
https://blog.csdn.net/sundan93/article/details/62888068
參照以上連接,先在外網電腦下載 Python 安裝文件以及相關的模塊安裝文件,拷貝到無網絡電腦進行安裝
以上表格整理的實例在現實工做有參考意義麼:
回答:文中表格的原型是一份員工工做記錄,根據人員分組進行相關的數據統計。相似的分組統計成員數據均可以根據此簡單 Python 模版來實現。
源代碼:https://pan.baidu.com/s/1ro4lUaRtRb86Lf49LSjRBA (權當一個參考和提示,自行搜索嘗試實現才能真正掌握哈,有問題歡迎留言反饋~)