簡單爬取github下載鏈接

這幾天在看《python3 網絡爬蟲實戰》,裏面用到了tesseract和它對應的語言包,爲了避免使用這個庫出錯,我就開始在github上下載對應的語言包,但是無論是使用瀏覽器,還是wget下載,都會在下載一大半的時候出錯,於是萌生了一個分開下載的念頭。轉念一想,自己手動根據鏈接下載比較簡單,但是麻煩,而且重複;而恰好正在學習爬蟲的相關知識,因此有了下面的代碼。 本示例代碼爬取了https://g
相關文章
相關標籤/搜索