本文同步發表於 Prodesire 公衆號和 Prodesire 博客。python
2019 年末開始蔓延的新型肺炎疫情牽動人心,做爲個體,咱們力所能及的就是儘可能待在家中少出門。git
看到一些朋友叫設計同窗幫忙給本身的頭像戴上口罩,做爲技術人,心想必定還有更多人有這樣的訴求,不如開發一個簡單的程序來實現這個需求,也算是幫助設計姐姐減小工做量。github
因而花了些時間,寫了一個叫作 face-mask 的命令行工具,可以輕鬆的給圖片中的人像戴上口罩,並且口罩的方向和大小都是適應人臉的哦~bash
face-mask
確保 Python 版本在 3.6 及以上工具
pip install face-mask
face-mask
直接指定圖片路徑便可爲圖片中的人像戴上口罩,並會生成一個新的圖片(額外有 -with-mask
後綴):命令行
face-mask /path/to/face/picture
經過指定 --show
選項,還能夠使用默認圖片查看器打開新生成的圖片:設計
face-mask /path/to/face/picture --show
給一我的戴上口罩code
給多我的戴上口罩orm
給動漫人物戴上口罩blog
要想實現上面的效果,咱們應該怎麼作?不妨這麼想:
關於人臉識別,能夠使用 face_recognition 庫進行識別。
關於圖像處理,能夠使用 Pillow 庫進行處理。
有了思路以後,實現就是件相對輕鬆的事情。不過對庫的熟悉和圖片的變換計算可能要花些時間。
詳細的代碼請閱讀 face-mask。這裏僅說明下最核心的步驟。
import face_recognition face_image_np = face_recognition.load_image_file('/path/to/face/picture') face_landmarks = face_recognition.face_landmarks(face_image_np)
藉助 face_recognition
庫能夠輕鬆的識別出人像,最終獲得的 face_landmarks
是一個列表,裏面的每一個 face_landmark
都表示一我的像數據。
face_landmark
是一個字典,其中的鍵表示人像特徵,值表示該特徵的點的列表。好比:
nose_bridge
表示鼻樑chin
表示臉頰咱們須要根據每一個 face_landmark
,給對應的頭像戴上口罩。
import numpy as np nose_bridge = face_landmark['nose_bridge'] nose_point = nose_bridge[len(nose_bridge) * 1 // 4] nose_v = np.array(nose_point) chin = face_landmark['chin'] chin_len = len(chin) chin_bottom_point = chin[chin_len // 2] chin_bottom_v = np.array(chin_bottom_point) chin_left_point = chin[chin_len // 8] chin_right_point = chin[chin_len * 7 // 8]
經過上述代碼,咱們得到了:
nose_point
chin_left_point
chin_right_point
chin_bottom_point
from PIL import Image _face_img = Image.fromarray(face_image_np) _mask_img = Image.open('/path/to/mask/picture') # split mask and resize width = _mask_img.width height = _mask_img.height width_ratio = 1.2 new_height = int(np.linalg.norm(nose_v - chin_bottom_v)) # left mask_left_img = _mask_img.crop((0, 0, width // 2, height)) mask_left_width = get_distance_from_point_to_line(chin_left_point, nose_point, chin_bottom_point) mask_left_width = int(mask_left_width * width_ratio) mask_left_img = mask_left_img.resize((mask_left_width, new_height)) # right mask_right_img = _mask_img.crop((width // 2, 0, width, height)) mask_right_width = get_distance_from_point_to_line(chin_right_point, nose_point, chin_bottom_point) mask_right_width = int(mask_right_width * width_ratio) mask_right_img = mask_right_img.resize((mask_right_width, new_height)) # merge mask size = (mask_left_img.width + mask_right_img.width, new_height) mask_img = Image.new('RGBA', size) mask_img.paste(mask_left_img, (0, 0), mask_left_img) mask_img.paste(mask_right_img, (mask_left_img.width, 0), mask_right_img)
上述代碼主要作了以下內容:
get_distance_from_point_to_line
用來獲取一個點到一條線的距離,具體實現可看源代碼。
width_ratio
是寬度係數,用來適當擴大口罩。緣由咱們是根據臉頰的寬度計算口罩的寬度,但口罩是待在耳朵上的,真實寬度應該要更寬。
# rotate mask angle = np.arctan2(chin_bottom_point[1] - nose_point[1], chin_bottom_point[0] - nose_point[0]) rotated_mask_img = mask_img.rotate(angle, expand=True) # calculate mask location center_x = (nose_point[0] + chin_bottom_point[0]) // 2 center_y = (nose_point[1] + chin_bottom_point[1]) // 2 offset = mask_img.width // 2 - mask_left_img.width radian = angle * np.pi / 180 box_x = center_x + int(offset * np.cos(radian)) - rotated_mask_img.width // 2 box_y = center_y + int(offset * np.sin(radian)) - rotated_mask_img.height // 2 # add mask _face_img.paste(mask_img, (box_x, box_y), mask_img)
上述代碼主要作了以下內容:
最後就是將新圖片保存到本地路徑,代碼再也不展現。
咱們藉助 face_recognition
庫能夠輕鬆的識別出人像,而後根據臉頰的寬度和鼻樑位置計算出口罩的大小、方向和位置,並最終生成出戴上口罩的圖片。整個過程並不複雜,但在座標計算上要格外當心,如此,咱們便打造了一個短小精悍的「自動戴上口罩」程序!
本文由博客一文多發平臺 OpenWrite 發佈!