本文同步發表於 Prodesire 公衆號和 Prodesire 博客。python
2019 年末開始蔓延的新型肺炎疫情牽動人心,做爲個體,咱們力所能及的就是儘可能待在家中少出門。git
看到一些朋友叫設計同窗幫忙給本身的頭像戴上口罩,做爲技術人,心想必定還有更多人有這樣的訴求,不如開發一個簡單的程序來實現這個需求,也算是幫助設計姐姐減小工做量。github
因而花了些時間,寫了一個叫作 face-mask 的命令行工具,可以輕鬆的給圖片中的人像戴上口罩,並且口罩的方向和大小都是適應人臉的哦~bash
face-mask
確保 Python 版本在 3.6 及以上工具
pip install face-mask
複製代碼
face-mask
直接指定圖片路徑便可爲圖片中的人像戴上口罩,並會生成一個新的圖片(額外有 -with-mask
後綴):spa
face-mask /path/to/face/picture
複製代碼
經過指定 --show
選項,還可使用默認圖片查看器打開新生成的圖片:命令行
face-mask /path/to/face/picture --show
複製代碼
給一我的戴上口罩設計
給多我的戴上口罩code
給動漫人物戴上口罩orm
要想實現上面的效果,咱們應該怎麼作?不妨這麼想:
關於人臉識別,可使用 face_recognition 庫進行識別。
關於圖像處理,可使用 Pillow 庫進行處理。
有了思路以後,實現就是件相對輕鬆的事情。不過對庫的熟悉和圖片的變換計算可能要花些時間。
詳細的代碼請閱讀 face-mask。這裏僅說明下最核心的步驟。
import face_recognition
face_image_np = face_recognition.load_image_file('/path/to/face/picture')
face_landmarks = face_recognition.face_landmarks(face_image_np)
複製代碼
藉助 face_recognition
庫能夠輕鬆的識別出人像,最終獲得的 face_landmarks
是一個列表,裏面的每一個 face_landmark
都表示一我的像數據。
face_landmark
是一個字典,其中的鍵表示人像特徵,值表示該特徵的點的列表。好比:
nose_bridge
表示鼻樑chin
表示臉頰咱們須要根據每一個 face_landmark
,給對應的頭像戴上口罩。
import numpy as np
nose_bridge = face_landmark['nose_bridge']
nose_point = nose_bridge[len(nose_bridge) * 1 // 4]
nose_v = np.array(nose_point)
chin = face_landmark['chin']
chin_len = len(chin)
chin_bottom_point = chin[chin_len // 2]
chin_bottom_v = np.array(chin_bottom_point)
chin_left_point = chin[chin_len // 8]
chin_right_point = chin[chin_len * 7 // 8]
複製代碼
經過上述代碼,咱們得到了:
nose_point
chin_left_point
chin_right_point
chin_bottom_point
from PIL import Image
_face_img = Image.fromarray(face_image_np)
_mask_img = Image.open('/path/to/mask/picture')
# split mask and resize
width = _mask_img.width
height = _mask_img.height
width_ratio = 1.2
new_height = int(np.linalg.norm(nose_v - chin_bottom_v))
# left
mask_left_img = _mask_img.crop((0, 0, width // 2, height))
mask_left_width = get_distance_from_point_to_line(chin_left_point, nose_point, chin_bottom_point)
mask_left_width = int(mask_left_width * width_ratio)
mask_left_img = mask_left_img.resize((mask_left_width, new_height))
# right
mask_right_img = _mask_img.crop((width // 2, 0, width, height))
mask_right_width = get_distance_from_point_to_line(chin_right_point, nose_point, chin_bottom_point)
mask_right_width = int(mask_right_width * width_ratio)
mask_right_img = mask_right_img.resize((mask_right_width, new_height))
# merge mask
size = (mask_left_img.width + mask_right_img.width, new_height)
mask_img = Image.new('RGBA', size)
mask_img.paste(mask_left_img, (0, 0), mask_left_img)
mask_img.paste(mask_right_img, (mask_left_img.width, 0), mask_right_img)
複製代碼
上述代碼主要作了以下內容:
get_distance_from_point_to_line
用來獲取一個點到一條線的距離,具體實現可看源代碼。
width_ratio
是寬度係數,用來適當擴大口罩。緣由咱們是根據臉頰的寬度計算口罩的寬度,但口罩是待在耳朵上的,真實寬度應該要更寬。
# rotate mask
angle = np.arctan2(chin_bottom_point[1] - nose_point[1], chin_bottom_point[0] - nose_point[0])
rotated_mask_img = mask_img.rotate(angle, expand=True)
# calculate mask location
center_x = (nose_point[0] + chin_bottom_point[0]) // 2
center_y = (nose_point[1] + chin_bottom_point[1]) // 2
offset = mask_img.width // 2 - mask_left_img.width
radian = angle * np.pi / 180
box_x = center_x + int(offset * np.cos(radian)) - rotated_mask_img.width // 2
box_y = center_y + int(offset * np.sin(radian)) - rotated_mask_img.height // 2
# add mask
_face_img.paste(mask_img, (box_x, box_y), mask_img)
複製代碼
上述代碼主要作了以下內容:
最後就是將新圖片保存到本地路徑,代碼再也不展現。
咱們藉助 face_recognition
庫能夠輕鬆的識別出人像,而後根據臉頰的寬度和鼻樑位置計算出口罩的大小、方向和位置,並最終生成出戴上口罩的圖片。整個過程並不複雜,但在座標計算上要格外當心,如此,咱們便打造了一個短小精悍的「自動戴上口罩」程序!