2016年10月31日 15:24:24 閱讀數:12192更多html
</pre><pre>
最近須要用到selenium瀏覽器抓取,在windows下對照chrome瀏覽器開發的代碼,在linux服務器上換成phantomjs驅動後,卻不能運行了,經過截圖發現phantomjs渲染效果和chrome不一樣。因而考慮在centos上安裝chrome瀏覽器。python
下面是作的一些記錄。linux
vi /etc/yum.repos.d/google.repoweb
[google]name=Google-x86_64baseurl=http://dl.google.com/linux/rpm/stable/x86_64enabled=1gpgcheck=0gpgkey=https://dl-ssl.google.com/linux/linux_signing_key.pubchrome
yum update , 而後yum install google-chrome-stablevim
這時候在非root帳號下運行google-chrome會輸出沒有顯示器,沒法啓動之類的。windows
不知道爲何不能在root帳號下運行。centos
yum update瀏覽器
yum install Xvfb
yum -install libXfont
yum install xorg-x11-fonts*
(1)安裝selenium、pyvirtualdisplay
pip install selenium
pip install pyvirtualdisplay
(2)下載chromedriver
從https://sites.google.com/a/chromium.org/chromedriver/home下載chromedriver
配置在PATH路徑或者在腳本中指定路徑
(3) demo
vim test.py
# -*- coding:utf-8 -*-
from selenium import webdriver
from pyvirtualdisplay import Display
display = Display(visible=0, size=(800,600))
display.start()
driver = webdriver.Chrome("./chromedriver")
driver.get("http://www.baidu.com")
print driver.page_source
driver.quit()
display.stop()
指望輸出百度首頁的html文檔。
1, nohup Xvfb -ac :7 -screen 0 1280x1024x8 > /dev/null 2>&1 &
2, export DISPLAY=:7
3, java -jar selenium-server-standalone-3.0.1.jar
4,
<pre name="code" class="python"># -*- coding:utf-8 -*-
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
driver = webdriver.Remote(
command_executor='http://127.0.0.1:4444/wd/hub',
desired_capabilities=DesiredCapabilities.CHROME)
driver.get("http://www.baidu.com")
print driver.page_source
driver.quit()