用Python在Excel裏畫出蒙娜麗莎

以前看到過不少頭條,說哪國某人堅持了多少年自學使用excel畫畫,效果十分驚豔。
對於他們的耐心我十分敬佩。
可是做爲一個程序員,天然也得挑戰一下本身。
這種需求,咱們十分鐘就能夠完成!python

mona-lisa

基本思路

實現這個需求的基本思路是讀取這張圖片每個像素的色彩值,而後給excel裏的每個單元格填充上顏色。因此主要用到的是PILopenpyxl這兩個庫。git

PIL使用

PIL是Python裏面作圖像處理的時候十分經常使用的一個庫,功能也是十分的強大,這裏只須要用到PIL裏一小部分的功能。程序員

from PIL import Image
img = Image.open(img_path) # 讀取圖片
width, height = img.size # 獲取圖片大小
r, g, b = img.getpixel((w - 1, h - 1)) # 獲取像素色彩值
複製代碼

Image.open()是PIL裏面打開一張圖片的函數,支持多種圖片類型github

img_path是圖片路徑,能夠是相對路徑,也能夠是絕對路徑dom

img.size是獲取圖片的size屬性,包含圖片的寬和高函數

img.getpixel()是獲取圖片色彩值的函數,需傳入一個tuplelist,值爲像素座標xy測試

openpyxl使用

openpyxl幾乎是Python裏功能最全的操做excel文件的庫了,這裏也只須要用到它的一小部分功能。spa

import openpyxl
from openpyxl.styles import fills

workbook = openpyxl.Workbook() 
worksheet = workbook.active
cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)
workbook.save(out_file)
複製代碼

openpyxl.Workbook()新建一個excel文件excel

workbook.active 激活一個工做表code

cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)填充一個單元格,fill_type="solid"是填充類型,fgColor=hex_rgb是填充的顏色

workbook.save()保存文件,需傳入要保存的文件名

寫一段代碼

​ 寫這一個畫圖的需求須要用到的核心就是上面介紹的PILopenpyxl的幾種用法。可是在實際寫的時候,還會有一些其餘問題,好比:

  1. getpixel()獲取的顏色值是rgb十進制的,但fills.PatternFill 裏的fgColor`參數接收到的顏色值是十六進制的值

    這個問題其實就是十進制轉十六進制,很容易解決

    def int_to_16(num):
        num1 = hex(num).replace('0x', '')
        num2 = num1 if len(num1) > 1 else '0' + num1 # 位數只有一位的時候在前面補零
        return num2
    複製代碼
  2. excel的單元格默認是長方形,修改成正方形纔不會使圖片變形

    if h == 1:
      _w = cell.column
      _h = cell.col_idx
      # 調整列寬
      worksheet.column_dimensions[_w].width = 1
    
    # 調整行高
    worksheet.row_dimensions[h].height = 6
    複製代碼

​ 這裏用到了雙重for循環,外層是width,裏層是height,是一列一列的填充顏色,所以判斷if h == 1,避免屢次調整列寬。

  1. excel支持的樣式數量有限

    這個問題比較嚴重。若是直接對高清大圖進行操做,最後輸出的excel文件在打開的時候,可能會提示咱們文件有問題,須要自動修復。

    可是等它修復完成以後,會發現填充的全部顏色都消失了!

報錯信息
一開始覺得是使用的行列數過多了緣由。

查詢資料後發現,13版excel支持的大行數是1048576,最大列數是16384,咱們使用的單元格數量還遠沒達到限制。

在通過更換圖片、更換excel版本,修改代碼等不充分各類測試,才找到問題的緣由所在。

原來是由於,excel的原形是由多個xml文件,填充的顏色都存儲在一個style.xml文件裏面,當這個文件過大就會致使打開的時候報錯。

因此爲了解決這個問題,有兩個解決方案,第一是縮小圖片,第二是減小圖片顏色。縮小圖片的時候自帶減小圖片顏色的功能,減小圖片顏色的方法能夠採用灰度化、二值化等方法。

整體上來說,就是須要控制顏色數量*單元格數<閾值(3300w左右)

MAX_WIDTH = 300
MAX_HEIGHT = 300
def resize(img):
    w, h = img.size
    if w > MAX_WIDTH:
        h = MAX_WIDTH / w * h
        w = MAX_WIDTH

    if h > MAX_HEIGHT:
        w = MAX_HEIGHT / h * w
        h = MAX_HEIGHT
    return img.resize((int(w), int(h)), Image.ANTIALIAS)
複製代碼

最終效果

蒼天不負有心人,打開最後輸出的excel已經能夠看到效果了!

因此說,一切能用Python解決的問題,最終都會用Python來解決。

image-20191117175137916

所有代碼

# draw_excel.py

from PIL import Image
import openpyxl
from openpyxl.styles import fills
import os

MAX_WIDTH = 300
MAX_HEIGHT = 300

def resize(img):
    w, h = img.size
    if w > MAX_WIDTH:
        h = MAX_WIDTH / w * h
        w = MAX_WIDTH

    if h > MAX_HEIGHT:
        w = MAX_HEIGHT / h * w
        h = MAX_HEIGHT
    return img.resize((int(w), int(h)), Image.ANTIALIAS)


def int_to_16(num):
    num1 = hex(num).replace('0x', '')
    num2 = num1 if len(num1) > 1 else '0' + num1
    return num2


def draw_jpg(img_path):

    img_pic = resize(Image.open(img_path))
    img_name = os.path.basename(img_path)
    out_file = './result/' + img_name.split('.')[0] + '.xlsx'
    if os.path.exists(out_file):
        os.remove(out_file)

    workbook = openpyxl.Workbook()
    worksheet = workbook.active

    width, height = img_pic.size

    for w in range(1, width + 1):

        for h in range(1, height + 1):
            if img_pic.mode == 'RGB':
                r, g, b = img_pic.getpixel((w - 1, h - 1))
            elif img_pic.mode == 'RGBA':
                r, g, b, a = img_pic.getpixel((w - 1, h - 1))

            hex_rgb = int_to_16(r) + int_to_16(g) + int_to_16(b)

            cell = worksheet.cell(column=w, row=h)

            if h == 1:
                _w = cell.column
                _h = cell.col_idx
                # 調整列寬
                worksheet.column_dimensions[_w].width = 1
            # 調整行高
            worksheet.row_dimensions[h].height = 6
            
            cell.fill = fills.PatternFill(fill_type="solid", fgColor=hex_rgb)

        print('write in:', w, ' | all:', width + 1)
    print('saving...')
    workbook.save(out_file)
    print('success!')

if __name__ == '__main__':
    draw_jpg('mona-lisa.jpg')
複製代碼

附:

上面說到 顏色數量*單元格數<閾值(256^4左右)的時候,可能有人會有疑惑,這個256^4是怎麼來的。

這個固然是我測試信口開河得來的。

既然是有顏色數量單元格數這兩個變量,那麼天然要有兩個測試方法以上。一個觀察顏色數量,一個觀察單元格數

但我在這裏只作了顏色數量的一個測試。(最大的緣由就是生成上萬行*上萬列的excel實在是過久了...懶...)

count = 0
    MAX_WIDTH = 255
    for w in range(1, MAX_WIDTH + 1):
        for h in range(1, MAX_WIDTH + 1):
            cell = worksheet.cell(column=w, row=h)
            if h == 1:
                _w = cell.column
                _h = cell.col_idx
                # 調整列寬
                worksheet.column_dimensions[_w].width = 1
            # 調整行高
            worksheet.row_dimensions[h].height = 6
            
            if count < 255 ** 3:
                back = int_to_16(num=count)
                back = '0' * (6 - len(back)) + back
            else:
                back = ''.join([int_to_16(random.randint(0, 255)) for _ in range(3)])
            cell.fill = fills.PatternFill(fill_type="solid", fgColor=back)
            count += 1
複製代碼

count是記錄顏色的變量,確保每個顏色都不重複,但目前計算機RGB表示的顏色最多隻有256^3種

經過調整MAX_WIDTH的值來測試excel的閾值

最後生成的測試excel以下:

image-20191117223918873
...還有點好看。!??


最後

因爲精力有限 ,能力也有限 ,因此沒有測試單一顏色的,也可能有其餘的方法能沒有這個閾值的限制。

代碼已經所有上傳至github,歡迎你們友好交流討論 [握手]

相關文章
相關標籤/搜索