google-images-download 用於批量下載圖片
google-images-download 是個 Python 腳本。一條命令,就完成 Google 圖片搜索和批量下載功能。而且,這工具還跨平臺運行,Linux, Windows 和 macOS 都支持。簡直是懶人福音。
首先,我們先指定圖片要下載的位置,我把它指定到了「下載(Download)」這個文件夾:
cd ~/Downloads
然後,在終端裏執行即可:
googleimagesdownload -k "譚卓" -l 20
這行代碼中:
最後的 Error: 1 說明, 下載過程中,發生了一個錯誤。但程序依然正常地將下載流程運行完畢。
我們發現,下載的圖片已經都存放在 ~/Downloads/downloads/譚卓 下面。google-images-download 非常貼心地,爲我們建立子目錄。
基本上,這一行命令就能幫我們解決正常情況下,批量下載圖片的需求了。
然而,在有的情況下,我們需要下載的圖片遠遠大於 20 張。比如說我看了半天照片,還是分不大清楚郝蕾和譚卓。那麼爲了徹底分清兩位女演員,我打算再下載 200 張郝蕾的照片試試。
仿照剛纔的命令,執行:
googleimagesdownload -k "郝蕾" -l 200
然後,你會發現報錯了:
遇到問題,不要慌。你得認真看看錯誤提示。注意其中出現了一個關鍵詞:chromedriver。這是個什麼東西呢?
我們回到 google-images-download 的 github 頁面,以 chromedriver 爲關鍵詞進行檢索。你會立即找到如下結果:
原來,當我們下載的圖片數量超過 100 張時,程序就必須調用 Selenium 和 chromedriver 才行。不知道它倆是啥無所謂,要了咱裝就行了。
Selenium 在我們安裝 google-images-download 的時候,就已經同時安裝好了。現在我們只需要下載 chromedriver 即可
接下來我們就可以批量下載超過 100 張圖片了。執行以下命令:
googleimagesdownload -k "郝蕾" -l 200 --chromedriver="./chromedriver"
我們會發現多了一個 參數 --chromedriver。它是用來告訴 google-images-download 解壓後 chromedriver 的所在路徑。這回機器勤勤懇懇,幫我們下載郝蕾的照片了
下載完畢後發現也有一些報錯,部分圖片沒有正確下載。但這對總體結果沒有太大影響。爲了保險起見,建議你設置下載數量時,多設置一些。給自己留出安全邊際嘛。
運行參數
我數了一下,一共有39項。篇幅所限,這裏就不一一展開羅列了。但是其中幾個特色參數,我還是希望提示你一下,因爲你在實際工作中,很可能會覺得它們有用處。
最後還有一個參數,是 ---safe_search,它的作用是啓用安全搜索,來保證搜索結果中,不會出現不利於精神文明建設的內容。