剛開始爬取了 百度圖片和搜狗圖片html
可是圖片不是不少,隨後繼續爬取淘寶圖片,可是淘寶反爬比較厲害 以前的方法不能用git
記錄可行的 淘寶爬取 利用selenium爬取github
https://cloud.tencent.com/developer/article/1151774正則表達式
githubide
https://github.com/Python3WebSpider/TaobaoProducthtm
(須要修改代碼,本身掃碼登錄 繼續爬)看issuesblog
注意:爬多了 肯能出現滑塊驗證 使用開發者模式避免圖片
利用pyquery進行搜索 就不須要正則表達式了開發
使用方法get