PhantomJS是一個無界面的、可腳本編程的WebKit瀏覽器引擎,它原生支持多種Web標準:DOM操做、CSS選擇器、JSON、Canvas以及SVG。html
Selenium支持PhantomJS,這樣在運行的時候就不會再彈出一個瀏覽器了。並且PhantomJS的運行效率也很高,還支持各類參數配置,使用很是方便。下面咱們就來了解一下PhantomJS的安裝過程。web
咱們須要在官方網站下載對應的安裝包,PhantomJS支持多種操做系統,好比Windows、Linux、Mac、FreeBSD等,咱們能夠選擇對應的平臺並將安裝包下載下來。編程
下載完成後,將PhantomJS可執行文件所在的路徑配置到環境變量裏。好比在Windows下,將下載的文件解壓以後並打開,會看到一個bin文件夾,裏面包括一個可執行文件phantomjs.exe,咱們須要將它直接放在配置好環境變量的路徑下或者將它所在的路徑配置到環境變量裏。好比,咱們既能夠將它直接複製到Python的Scripts文件夾,也能夠將它所在的bin目錄加入到環境變量。api
Windows下環境變量的配置能夠參見1.1節,Linux及Mac環境變量的配置能夠參見1.2.3節,在此再也不贅述,關鍵在於將PhantomJS的可執行文件所在路徑配置到環境變量裏。瀏覽器
配置成功後,能夠在命令行下測試一下,輸入:測試
phantomjs
若是能夠進入到PhantomJS的命令行,那就證實配置完成了,如圖1所示。網站
圖1控制檯ui
在Selenium中使用的話,咱們只須要將Chrome切換爲PhantomJS便可:url
from selenium import webdriver browser = webdriver.PhantomJS() browser.get('https://www.baidu.com') print(browser.current_url)
運行以後,咱們就不會發現有瀏覽器彈出了,但實際上PhantomJS已經運行起來了。這裏咱們訪問了百度,而後將當前的URL打印出來。spa
控制檯的輸出以下:
https://www.baidu.com/
如此一來,咱們便完成了PhantomJS的配置,後面能夠利用它來完成一些頁面的抓取。
這裏咱們介紹了Selenium對應的三大主流瀏覽器的對接方式,後面咱們會對Selenium及各個瀏覽器的對接方法進行更加深刻的探究。