python爬蟲之Phantomjs安裝和使用

phantomjs:

  PhantomJS是一個無界面的,可腳本編程的WebKit瀏覽器引擎。它原生支持多種web 標準:DOM 操做,CSS選擇器,JSON,Canvas 以及SVG。html

phantomjs:

  一、無UI界面的網站測試python

  二、屏幕快照web

  三、頁面操做自動化chrome

 

官方文檔:http://phantomjs.org/api/command-line.html編程

官方下載:http://phantomjs.org/downloadapi

一、下載完成後放到本身喜歡的一個位置,而後進入bin文件夾,而後把這個路徑添加到環境變量裏面。瀏覽器

 

 使用:緩存

 學習過Selenium的同窗都知道webdriver.chrome(),使用谷歌瀏覽器打開爬取頁面(或者是測試頁面),若是是.PhantomJS()的話就直接省去了系統打開頁面的步驟。學習

browser = webdriver.Chrome()
browser = webdriver.PhantomJS(service_args=SERVICE_ARGS)

 service_args= 這裏寫的是參數,參數以下:測試

  一、不加載圖片

  二、啓用硬盤緩存

SERVICE_ARGS = ['--load-images=false','--disk-cache=true']
相關文章
相關標籤/搜索