須要有python基礎html
python爬蟲相關網絡請求包python
curl簡單去學習curl,在模擬請求的時候能夠用curl去調試web
chrome瀏覽器:通常的web的抓取,用chrome的調試工具調試便可,大部分問題能夠解決(包括抓包、調試js代碼),切記熟練使用chrome調試工具。chrome
火狐瀏覽器:當chrome隱藏了一些請求頭信息的時候,能夠使用火狐瀏覽器去抓包,火狐中能夠看到。windows
抓包工具charles(Mac os)和fiddler(windows)必須熟悉其中一種。抓app數據包時必須用獲得。瀏覽器
爬蟲框架:scrapy網絡
解析經常使用python包app
某些網站作反扒作的很嚴重,須要調用瀏覽器來抓取了python爬蟲
上面這些應付web端爬蟲目前是能夠了,app端抓取可能會使用到一些其餘技術,好比說anyproxy等。框架