一直對web爬蟲充滿了興趣,搜索一番,決定從scrapy開發,此係列文章分兩篇,安裝與實例編寫。
個人軟件環境與版本爲:windows七、Python3.5html
Python的安裝就不說了,直接進入scrapy的相關安裝。安裝前閱讀安裝文檔。web
按照文檔說明,其推薦安裝 Anaconda or Miniconda,可能會避免一些沒必要要的麻煩,雖然不知道爲何,但照作應該是不會錯的 heihei)
打開 https://conda.io/docs/user-guide/install/index.html,找到下圖,點擊windows的;在自後的網頁上部分找到Installing on Windows,點擊Miniconda for Windows;周後選擇適合於本身Windows的版本下載就行了(個人是64位的)。
windows
下載完成後,按照通常Windows上安裝軟件的流程安裝就行了,一路next便可。安裝完成後,會發現開始菜單中多了一個
scrapy
之後關於scrapy的命令行操做在這個提示符裏完成便可。ide
接下來,文檔又建議在開發時儘可能使用虛擬環境,virtualenv是啥?ui
開發多個Python項目時,不一樣項目可能用的Python版本不一樣或者依賴的第三方包也不一樣,可是系統安裝的Python版本只有一個(好比3.5),腫麼辦?那麼virtualenv就派上用場了,virtualenv能夠隔離各個項目,不一樣項目能夠擁有本身的運行環境。spa
打開前面提到的Anaconda Prompt,輸入pip install virtualenv
便可安裝命令行
Scrapy既能夠全局安裝也能夠局部安裝,我這裏是局部安裝,只安裝在了爬蟲的項目中
打開Anaconda Prompt,定位到項目目錄(D:\py\scrapytest)
經過virtualenv --no-site-packages venv
命令,建立該目錄的虛擬環境,環境名爲venv。
而後經過venv\Scripts\activate
激活該環境,注意到命令前有(venv)
表示該虛擬環境下。
而後經過conda install -c conda-forge scrapy
安裝scrapy,安裝完成事後輸入scrapy,若顯示版本號,則證實以安裝成功
code
用Scrapy編寫一個爬取豆瓣8.9評分以上軍事類圖書的小爬爬htm