使用Python編寫爬蟲,固然至少得了解Python基本的語法,瞭解:html
不須要過多過深的Python知識,僅此而已。
我的推薦《Python簡明教程》、Python官方的《Python教程》python
若是你在學習Python的過程當中碰見了不少疑問和難題,能夠加-q-u-n 227 -435-450裏面有軟件視頻資料免費windows
上面列出的第三方模塊大多能夠經過pip install ××的方式直接安裝,部分模塊安裝方式不同,下面一一演示:
requests
pip install requests
數據結構
BeautifulSoup
pip install bs4
框架
pymongo
pip install pymongo
函數
selenium
pip install selenium
學習
Pillow
一、打開http://www.lfd.uci.edu/~gohlke/pythonlibs/
二、搜索找到「pillow」
三、根據本身系統的版本選擇對應的下載包測試
四、安裝
pip install Pillow‑4.0.0‑cp34‑cp34m‑win32.whl
spa
pytesseract
一、pip install pytesseract
操作系統
二、安裝tesseract
下載並安裝:
這樣,咱們的準備工做就基本完成,若是有另外的需求,在實戰中再進行安裝,接下來就能夠實戰Python爬蟲實戰了。