在以前的文章:使用Python爬取天貓店鋪聯繫方式|思路與方法 中咱們介紹瞭如何使用Python採集天貓店鋪的企業聯繫方式。html
在採集的過程當中,咱們有兩個地方須要對圖片進行處理,其中一個是驗證碼:小程序
在這裏咱們須要將驗證碼下載到本地並進行驗證碼識別。第二個地方則是店鋪工商執照的照片:bash
圖片是帶有天貓的灰色水印的,咱們將圖片下載下來:微信
若是這樣直接對圖片進行ORC文字識別,有可能會致使不能正確識別出公司名稱來。咱們須要對水印進行去除。工具
要對普通的圖片水印進行去除,咱們能夠對圖片進行灰度轉換,而後再進行二值化轉換。可是這樣的方法容易形成圖片的失真。ui
針對如上圖這種配色單一的水印圖片,咱們能夠直接將水印顏色填充替換爲白色,從而實現水印的快速去除。spa
核心代碼以下所示:3d
import cv2
import traceback
try:
# 讀取圖片
img = cv2.imread(filename)
# 獲取圖片大小
x, y, z = img.shape
for i in range(x):
for j in range(y):
varP = img[i, j]
if sum(varP) == 687:
img[i, j] = [255, 255, 255]
cv2.imwrite('zmister_qushuiyin.jpg', img)
except Exception as e:
print(traceback.print_exc())
複製代碼
這樣,咱們的圖片就能夠快速去除天貓的水印:code
上面的代碼快速地實現了天貓文字水印的去除,可是做爲代碼自己就不方便傳播和使用。索性藉助於PyQt5,咱們將其打包爲一個桌面圖形界面程序。cdn
這樣,一個簡單的去水印桌面小程序就寫完了。 須要源碼的能夠關注微信公衆號:州的先生,回覆關鍵字去水印源碼進行獲取。
文章來源:州的先生博客,歡迎分享,轉載請保留出處