有一萬年沒來這兒寫blog了,今天等着發版,抽空來寫點東西吧。html
python有不少模塊都是用來操做excel的,好比xlrd,xlwt,pyExcelerator。用着很方便,可是問題是,只能支持到excel2003。雖然通常的應用其實足夠了,可是若是遇到了導出大量數據(超過65535條)的需求時,excel2003就不夠用了。因此我就只好去找一個能支持excel2007的模塊。python
google了一下,發現了這個openpyxl,不過網上也沒什麼中文的文檔能夠看,因而就本身琢磨琢磨。數據庫
I.安裝api
openpyxl的最新版本是1.5.0 下載地址 http://pypi.python.org/pypi/openpyxl/1.5.0google
需求python的版本是2.6+ ,也就是說,若是centOS系統的機器想用,那得升級系統的python。。。spa
安裝就是解壓縮,而後cd到目錄,而後.net
python setup.py installexcel
你懂的~orm
II.讀取excel2007文件htm
[python] view plaincopy
#-*- coding:utf-8 -*
from openpyxl.reader.excel import load_workbook
import MySQLdb
import time
#開始時間
startTime = time.time()
#讀取excel2007文件
wb = load_workbook(filename = r'empty_book.xlsx')
#顯示有多少張表
print "Worksheet range(s):", wb.get_named_ranges()
print "Worksheet name(s):", wb.get_sheet_names()
#取第一張表
sheetnames = wb.get_sheet_names()
ws = wb.get_sheet_by_name(sheetnames[0])
#顯示錶名,錶行數,表列數
print "Work Sheet Titile:",ws.title
print "Work Sheet Rows:",ws.get_highest_row()
print "Work Sheet Cols:",ws.get_highest_column()
# 創建存儲數據的字典
data_dic = {}
#把數據存到字典中
for rx in range(ws.get_highest_row()):
temp_list = []
pid = ws.cell(row = rx,column = 0).value
w1 = ws.cell(row = rx,column = 1).value
w2 = ws.cell(row = rx,column = 2).value
w3 = ws.cell(row = rx,column = 3).value
w4 = ws.cell(row = rx,column = 4).value
temp_list = [w1,w2,w3,w4]
data_dic[pid] = temp_list
#打印字典數據個數
print 'Total:%d' %len(data_dic)
注意的是ws.cell()方法,支持的參數有兩種,cell(coordinate=None, row=None, column=None)
coordinate座標,eg ws.cell("B1")
row 和 column 是行和列 ,都是從0開始
還有,若是想取得格里的值,得用ws.cell("A1").value 取到,若是用過xlrd,由於寫法差很少,可能就會忘記加value了。
III.寫入excel2007
[python] view plaincopy
寫excel2007
#-*- coding:utf-8 -*
import MySQLdb
import time
import sys
#workbook相關
from openpyxl.workbook import Workbook
#萬惡的ExcelWriter,妹的封裝好了不早說,封裝了很強大的excel寫的功能
from openpyxl.writer.excel import ExcelWriter
#一個eggache的數字轉爲列字母的方法
from openpyxl.cell import get_column_letter
#新建一個workbook
wb = Workbook()
#新建一個excelWriter
ew = ExcelWriter(workbook = wb)
#設置文件輸出路徑與名稱
dest_filename = r'empty_book.xlsx'
#第一個sheet是ws
ws = wb.worksheets[0]
#設置ws的名稱
ws.title = "range names"
#錄入數據,注意col是數字轉字母,而後須要限定%s(string型)當參數傳到ws.cell()方法中去,records能夠想象爲一個從數據庫裏查詢出來的數據集合
i=1
table = {}
for record in records:
for x in range(1,len(record)+1):
col = get_column_letter(x)
ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])
i+=1
#又建了一個sheet,ws名字都沒變,太省了。。。可是確實是一個新的sheet,不會影響以前那個sheet的東西
ws = wb.create_sheet()
ws.title = 'Pi'
ws.cell('F5').value = 3.14
#寫文件
ew.save(filename = dest_filename)
注意的地方:
# col是用列號x爲參數,調用了這個模塊的get_column_letter方法算出來的字母,這個比較蛋疼。
col = get_column_letter(x)
#在爲數據格賦值的時候,注意寫的格式:要不會有各類不靠譜的問題出現(這個是用座標的方式寫的,其實用row ,col的方式可能沒那麼麻煩)
ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])
關於該模塊的API 能夠查詢官方文檔 http://packages.python.org/openpyxl/api.html
整體來講,這個模塊仍是挺方便的,可是問題就是在對於python的版本有必定要求,若是在centOs上用,可能會有些問題。
本文只是簡單的寫了下使用的方法,以後格式超連接神馬的以後再填上~
關於pyExcelerator的使用教學,給朋友作個廣告 http://blog.csdn.net/suofiya2008/archive/2010/05/14/5589627.aspx