第七部分（一）動態渲染頁面爬取（Selenium的使用）

時間 2020-05-08

標籤第七部分動態渲染頁面 selenium 使用简体版

原文原文鏈接

Ajax分析和抓取方式，是JavaScript動態渲染頁面的一種情形，可以使用 requests 或 urllib 爬取數據。JavaScript動態渲染的頁面不是隻有Ajax一種，好比中國青年網 http://news.youth.cn/gn/ 的分頁部分由JavaScript生成的，不是原始的HTML代碼，可是不包含Ajax請求。又好比ECharts的官方實例 http://echarts.baidu.com/demo.html#bar-negative ，其圖形都是通過JavaScript計算後生成的。另外的淘寶頁面，有Ajax獲取的數據，可是Ajax接口含有不少加密參數，不容易找出規律，很難直接分析Ajax來獲取。

這些問題能夠經過使用模擬瀏覽器運行的方式來實現，這樣在瀏覽器中看到什麼樣，抓取的源碼就是什麼樣，也就是可見便可爬。不用管網頁內部的JavaScript用的什麼算法渲染頁面，也不用管網頁後臺的Ajax接口到底有哪些參數。

Python有許多模擬瀏覽器運行的庫，如Selenium、Splash、PyV八、Ghost等。下面瞭解下Selenium和Splash的用法，以應對動態渲染的頁面。

1、 Selenium的使用

Selenium是自動化測試工具，它能夠驅動瀏覽器執行特定的動做，如點擊、下拉等操做，同時還能夠獲取瀏覽器當前呈現的頁面的源代碼，作到可見便可爬。對於JavaScript動態渲染的頁面，這種抓取方法很是有效。

下面以Chrome爲例說明Selenium的用法。首先要正確安裝Chrome瀏覽器並配置好ChromeDriver。還要安裝好Python的Selenium庫。

一、 開始使用
首先看下Selenium大體有哪些功能。例以下面代碼所示：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait
browser = webdriver.Chrome()
try:
    browser.get('https://www.baidu.com')
    input = browser.find_element_by_id('kw')
    input.send_keys('Python')
    input.send_keys(Keys.ENTER)
    wait = WebDriverWait(browser, 10)
    wait.until(EC.presence_of_element_located((By.ID, 'content_left')))
    print(browser.current_url)
    print(browser.get_cookies())
    print(browser.page_source)
finally:
    browser.close()


運行這段代碼後會自動彈出一個Chrome瀏覽器，瀏覽器自動跳轉到百度首頁，而後在搜索框中輸入Python，接着跳轉到搜索結果頁。搜索結果加載出來後，控制檯分別會輸出當前的URL、當前的Cookies和網頁源代碼。Cookies以字典列表形式輸出。

這就是使用Selenium驅動瀏覽器加載網頁拿到JavaScript渲染的結果，沒必要擔憂是什麼加密系統。

二、 聲明瀏覽器對象
Selenium支持的瀏覽器很是多，如Chrome、Firefox、Edge等，還有Android、BlackBerry等手機端瀏覽器。還支持無界面瀏覽器PhangtomJS。可用下面這些方式初始這些瀏覽器對象：

from selenium import webdriver
browser = webdriver.Chrome()
browser = webdriver.Firefox()
browser = webdriver.Edge()
browser = webdriver.PhantomJS()
browser = webdriver.Safari()

這就是在初始化瀏覽對象並將其賦值爲browser對象。接下來能夠調用browser對象，讓其執行各個動做以模擬瀏覽器操做。

三、 訪問頁面
使用前面建立的瀏覽器對象的 get() 方法，參數是要訪問的連接URL。例如訪問淘寶首頁並輸出源代碼，示例以下：

from selenium import webdriver

chrome_options = webdriver.ChromeOptions()php

chrome_options.add_argument('--headless') # 無界面模式
browser = webdriver.Chrome(chrome_options=chrome_options)
browser.get('https://www.taobao.com')
print(browser.current_url)
print(browser.page_source)
browser.close()

運行代碼後不彈出Chrome瀏覽器並自動訪問淘寶，而後在控制檯輸出淘寶的網址和頁面的源代碼，隨後關閉瀏覽器。這幾行簡單的代碼就實現了瀏覽器的驅動並獲取網頁源代碼，很是便捷。

四、查找節點
Selenium還能夠驅動瀏覽器完成各類操做，如填充表單、模擬點擊等。好比要完成向某個輸入框輸入文字的操做，首先要找到輸入框。Selenium有提供一系列查找節點的方法，可用這些方法獲取想要的節點，以便下一步執行一些動做或者提取信息。

4.一、提取單個節點
例如要提取淘寶頁面中的搜索框節點，須要先觀察它的源代碼。如圖1-1所示。css

                                           圖1-1   搜索框源代碼

從源代碼能夠看到，搜索框節點的id是q，name也是q。另外還有許多其餘屬性，此時可用多種方式獲取它。好比，find_element_by_name()是根據name值獲取，find_element_by_id()是根據id獲取。還有根據 XPath、CSS 選擇器獲取的方式。代碼示例以下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.taobao.com')
input_first = browser.find_element_by_id('q')
input_second = browser.find_element_by_css_selector('#q')
input_third = browser.find_element_by_xpath('//*[@id="q"]')
print(input_first, input_second, input_third)
browser.close()

這裏用了3種方式獲取輸入框，分別是根據ID、CSS選擇器和XPath獲取，3種方式返回的結果徹底一致，而且都是WebElement類型。輸出以下所示：
<selenium.webdriver.remote.webelement.WebElement (session="5c88916914b54ea71fd04dc64adf2bc1", element="0.056290961173190324-1")>
<selenium.webdriver.remote.webelement.WebElement (session="5c88916914b54ea71fd04dc64adf2bc1", element="0.056290961173190324-1")>
<selenium.webdriver.remote.webelement.WebElement (session="5c88916914b54ea71fd04dc64adf2bc1", element="0.056290961173190324-1")>

獲取單個節點的方法有下面這些：
find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector

Selenium的通用方法 find_element()，需傳入兩個參數：查找方式 By和值。是find_element_by_id()方法的通用函數版本。如find_element_by_id(id)等價於find_element(By.ID, id)，兩種方法獲得的結果是同樣的。示例以下：

from selenium import webdriver
from selenium.webdriver.common.by import By
browser = webdriver.Chrome()
browser.get("https://www.taobao.com")
input_first = browser.find_element(By.ID, 'q')
print(input_first)
browser.close()

這種查找方式的參數更靈活，功能與前面列舉的是同樣的。

4.二、多個節點
find_element() 方法只能查找單個節點，就算有多個節點，也只能獲得第一個節點。節點類型是：WebElement。
find_elements() 方法能夠查找全部知足條件的節點。結果是列表類型，每一個節點類型是：WebElement

例如查找淘寶左側導航條的全部條目，經過源代碼分析可知，每個導航條都是用 li 標籤包起來的，這些導航條都有一個共同的父標籤
ul，ul標籤有class屬性，其屬性值是service-bd。可先根據class屬性值找到ul標籤，繼而找到下面的子標籤便可找到左側導航條
的全部節點。代碼以下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get("https://www.taobao.com")
lis = browser.find_elements_by_css_selector(".service-bd li")
print(lis)
browser.close()

輸出以下所示：
[<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-1")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-2")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-3")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-4")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-5")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-6")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-7")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-8")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-9")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-10")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-11")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-12")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-13")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-14")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-15")>,
<selenium.webdriver.remote.webelement.WebElement (session="4b1d6b1ad2469591d0fa83017d2aa992", element="0.7683288407073237-16")>]

輸出結果是列表類型，列表中的每一個節點都是WebElement類型。獲取多個節點的全部方法以下：
find_elements_by_id
find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector
通用方法：find_elements()

使用通用方法find_elements()方法選擇時，可這樣寫：
lis = browser.find_elements(By.CSS_SELECTOR, '.service-bd li')

五、節點交互
Selenium可讓瀏覽器模擬執行一些動做。常見用法有：輸入文字用 send_keys() 方法，清空文字用 clear() 方法，點擊按鈕用 click()方法。基本用法以下：

from selenium import webdriver
import time
browser = webdriver.Chrome()
browser.get("https://www.taobao.com")
input = browser.find_element_by_id('q')    # 獲取輸入框
input.send_keys("Mate20")                         # 輸入Mate20
time.sleep(1)
input.clear()                                                # 等待1秒後清空輸入框
input.send_keys("P20")                              # 從新輸入P20
button = browser.find_element_by_class_name('btn-search')   # 獲取搜索按鈕
button.click()     # 點擊搜索

上面代碼執行過程：首先驅動瀏覽器打開淘寶網站，而後用find_element_by_id()方法獲取輸入框，接着用send_keys()方法輸入Mate20文字，等待1秒後用clear()方法清空輸入框，再次調用send_keys()方法輸入P20，以後再用find_element_by_class_name()方法獲取搜索按鈕，最後調用click()方法完成搜索動做。

官方文檔的交互動做介紹：
http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.remote.webelement

六、動做鏈
前面的交互動做是針對某個節點執行的。例如，對於輸入框，可調用它的輸入文字和清空文字方法；對於按鈕，可調用它的點擊方法。有一些操做，它們沒有特定的執行對象，好比鼠標拖曳、鍵盤按鍵等，這些動做用另外一種方式來執行，就是動做鏈。

例如要實現一個節點的拖曳操做，將某個節點從一處拖曳到另外一處，可像下面這樣實現：

from selenium import webdriver
from selenium.webdriver import ActionChains
browser = webdriver.Chrome()
url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
browser.get(url)
browser.switch_to.frame('iframeResult')
source = browser.find_element_by_css_selector('#draggable')
target = browser.find_element_by_css_selector('#droppable')
actions = ActionChains(browser)
actions.drag_and_drop(source, target)
actions.perform()

運行這段代碼，首先打開網頁一個拖曳實例，接着選中要拖曳的節點和拖曳到的目標節點，再接着聲明ActionChains對象並將其賦值爲actions變量，而後經過調用actions變量的drag_and_drop()方法，再調用perform()方法執行動做，此時就完成拖曳操做。

動做連接官方文檔：
http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.common.action_chains

七、執行JavaScript
某些操做，SeleniumAPI 沒有提供。好比，下拉進度條操做就沒有，它可使用 execute_script() 方法直接模擬運行JavaScript來實現。示例以下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
browser.execute_script('window.scrollTo(0, document.body.scrollHeight)')
browser.execute_script('alert("To Bottom")')

代碼中利用execute_script()方法將進度條下拉到最底部，而後彈出alert提示框。有了這個方法，基本上API沒有提供的全部功能均可以用執行JavaScript的方式來實現。

八、獲取節點信息
page_source屬性可獲取網頁源代碼，解析庫（有正則表達式、Beautiful Soup、pyquery等）用來提取信息。Selenium有提供節點
選擇方法，返回的是WebElement類型，對應也有相關的方法和屬性直接提取節點信息，如屬性、文本等。

8.一、獲取屬性
get_attribute()方法獲取節點屬性，須要先選中節點，代碼示例以下：

from selenium import webdriver
browser = webdriver.Chrome()
url = 'https://www.zhihu.com/explore'
browser.get(url)
logo = browser.find_element_by_id('zh-top-link-logo')
print(logo)
print(logo.get_attribute('class'))

運行程序，驅動瀏覽器打開知乎頁面，而後獲取知乎的logo節點，最後打印出class。輸出信息以下所示：
<selenium.webdriver.remote.webelement.WebElement (session="db40cefb1cf4ac278c6832791fe74b26", element="0.46332722296830897-1")>
zu-top-link-logo

這樣經過get_attribute()方法傳入屬性名參數就可獲取到屬性值。

8.二、獲取文本值
每一個WebElement節點都有text屬性，調用該屬性可獲取節點內部的文本信息。至關於Beautiful Soup的get_text()方法、pyquery的text()方法，示例以下：

from selenium import webdriver
browser = webdriver.Chrome()         # 驅動打開瀏覽器
url = 'https://www.zhihu.com/explore'
browser.get(url)                                # 打開知乎頁面
input = browser.find_element_by_class_name('zu-top-add-question') # 獲取提問節點
print(input.text)                                # 輸出：提問

8.三、獲取id、位置、標籤名和大小
WebElement節點的其它屬性以下：
id屬性：獲取節點id
location屬性：獲取該節點在頁面中的相對位置
tag_name屬性：獲取標籤名稱
size屬性：獲取節點的大小，也是寬高
這幾個屬性在某些時候頗有用的。

from selenium import webdriver
browser = webdriver.Chrome()        # 驅動打開瀏覽器
url = 'https://www.zhihu.com/explore'
browser.get(url)                                # 打開知乎頁面
input = browser.find_element_by_class_name('zu-top-add-question') # 獲取提問節點
print(input.id)                                   # 獲取節點id
print(input.location)                         # 節點在頁面中的相對位置
print(input.tag_name)                      # 標籤名稱
print(input.size)                                # 標籤的寬高

輸出以下所示：
0.46332722296830897-2
{'x': 758, 'y': 7}
button
{'height': 32, 'width': 66}

九、切換Frame
網頁中有一種節點叫做 iframe，也是子Frame，至關於頁面的子頁面，子頁面結構與外部網頁結構徹底一致。Selenium打開頁面默認是在父級Frame裏面操做，頁面中若是有子Frame，它是不能獲取到子Frame裏面的節點。這時可以使用switch_to.frame()方法可切換frame。示例以下：
html

from selenium import webdriver
from selenium.common.exceptions import NoSuchElementException
browser = webdriver.Chrome()
url = 'http://www.runoob.com/try/try.php?filename=jqueryui-api-droppable'
browser.get(url)
browser.switch_to.frame('iframeResult')     # 切換到子frame
try:
    # 獲取父級Frame的logo節點，不成功就拋出NoSuchElementException異常
    logo = browser.find_element_by_class_name('logo')
except NoSuchElementException:
    print('NO LOGO')
browser.switch_to.parent_frame()    # 切換回父級Frame
logo = browser.find_element_by_class_name('logo')   # 獲取logo節點
print(logo)
print(logo.text)    # 輸出父級logo節點的文本

輸出以下所示：
NO LOGO
<selenium.webdriver.remote.webelement.WebElement (session="6e2ef8fd8e5d576d31cf86557ad39b67", element="0.4057476934894335-2")>
RUNOOB.COM

代碼中switch_to.frame()方法切換到子Frame，接着find_element_by_class_name('logo')獲取父級Frame的logo節點，未能獲取就拋出異常NoSuchElementException。切換回父級Frame，從新獲取logo節點，能夠成功獲取。若是頁面中有子Frame時，要獲取子Frame的節點，要先調用switch_to.frame()方法切換到對應的Frame後再進行操做。

十、延時等待
在Selenium中，get()方法在網頁框架加載結束後結束執行，此時獲取page_source，並非瀏覽器徹底加載完成的頁面，若是有額外的Ajax請求，在網頁源代碼中也不必定能成功獲取到。因此須要延時等待必定時間，確保節點已經加載出來。

延時等待有兩種方式：隱式等待；顯式等待。

10.一、隱式等待，implicitly_wait()
使用隱式等待測試時，若是Selenium沒有在DOM中找到節點，將繼續等待，超出設定時間後，就拋出找不到節點的異常。也就是說，在查找節點時節點沒有當即出現時，隱式等待將等待一段時間再查找DOM，默認等待時間是0。示例以下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.implicitly_wait(10)            # 調用隱式等待，等待10秒
browser.get('https://www.zhihu.com/explore')
input = browser.find_element_by_class_name('zu-top-add-question')
print(input)

10.二、顯式等待，WebDriverWait()
隱式等待方式會受到網絡條件影響，有的頁面加載時間過長。顯式等待是指定要查找的節點，並指定一個最長等待時間。若是在規定時間內加載出來了這個節點，就返回查找的節點；到了規定時間依然沒有加載出該節點，則拋出異常。示例以下：

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
browser = webdriver.Chrome()
browser.get('https://www.taobao.com/')
wait = WebDriverWait(browser, 10)       # 參數：等待對象及時長
# 在等待時間內獲取輸入框節點，經過ID查找
input = wait.until(EC.presence_of_element_located((By.ID, 'q')))
# 在等待時間內獲取點擊按鈕節點，經過CSS選擇器查找
button = wait.until(EC.element_to_be_clickable((By.CSS_SELECTOR, '.btn-search')))
print(input, button)

在代碼中引入WebDriverWait對象，指定最長等待時間爲10秒，接着調用它的 until() 方法，傳入要等待條件 expected_conditions。這裏傳入了 presence_of_element_located 這個條件，表示節點出現的意思，其參數是節點的定位元組，也就是ID爲q的節點搜索框。在10秒內ID爲q的節點（即搜索框）成功加載，就返回該節點；若是超過10秒尚未加載出來，就拋出異常。

按鈕的等待條件是 element_to_be_clickable，也就是可點擊。參數(By.CSS_SELECTOR, '.btn-search')意思是查找按鈕時查找CSS選擇器爲 .btn-search 的按鈕，若是10秒內它是可點擊，就成功加載出來並返回這個按鈕節點；若是10秒還不可點擊，就是沒有加載出來，則拋出異常。運行這段代碼，在網速好的狀況下可正常加載出來，而且輸出以下：
<selenium.webdriver.remote.webelement.WebElement (session="12fc5fa8bc80295340f5fd22433c6ec1", element="0.5824054028692756-1")>
<selenium.webdriver.remote.webelement.WebElement (session="12fc5fa8bc80295340f5fd22433c6ec1", element="0.5824054028692756-2")>

從輸出可知，輸出了兩個節點，都是WebElement類型。若是網絡有問題就拋出異常。在這段代碼用到了兩個等待條件，這些等待條件還
有不少，好比判斷標題內容，判斷某個節點內是否出現某文字等。表1-1是全部的等待條件。

表1-1 等待條件及其含義


更多等待條件參數及用法，參考官方文檔：
http://selenium-python.readthedocs.io/api.html#module-selenium.webdriver.support.expected_conditions

十一、前進和後退
在使用瀏覽器時有前進和後退功能，Selenium 也可完成這個操做。使用 back() 方法後退，使用 forward() 方法前進。

import time
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.taobao.com/')     # 連續訪問3個頁面
browser.get('https://www.baidu.com/')
browser.get('https://www.sina.com.cn/')
browser.back()                                            # 後退到百度頁面
time.sleep(1)
browser.forward()                                       # 前進到sina頁面
time.sleep(3)
browser.close()

這段代碼連續訪問3個頁面後調用back()方法回到第二個頁面，接下來調用forward()方法又前進到第三個頁面。

十二、對Cookies的操做
對Cookies進行操做方法主要有：獲取、添加、刪除等。
get_cookies()方法：獲取全部Cookies。
add_cookie(字典參數)：添加cookie，參數是字典。
delete_all_cookies()：刪除全部的cookies。
示例以下：

from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.zhihu.com/explore')
print("第一次cookies：", browser.get_cookies())     # 獲取cookies，接着下面添加cookies
browser.add_cookie({'name': 'name', 'domain': 'www.zhihu.com', 'value': 'michael'})
print("第二次cookies：", browser.get_cookies())     # 再次獲取cookies，覈實是否添加成功
browser.delete_all_cookies()                                   # 刪除全部cookies
print("第三次cookies：", browser.get_cookies())     # 覈實是否徹底刪除cookies
browser.close()

輸出以下，第二次輸出的cookies包含了添加的cookie：
第一次cookies： [{'domain': '.zhihu.com', 'httpOnly': False, ...}, ......]
第二次cookies： [{'domain': '.zhihu.com', 'httpOnly': False, ...}, ......, {'domain': 'www.zhihu.com', 'name': 'name', 'value': 'michael'}]
第三次cookies： []

1三、 Selenium模擬開啓選項卡
好比第一個選項卡打開百度網頁，第二個選項卡打開淘寶網頁。這些操做也可用Selenium來對選項卡進行操做。
window.open()是JavaScript語句的開啓一個選項卡。
execute_script('window.open()') 執行JavaScript語句開啓一個選項卡。
window_handles獲取當前開啓的選項卡，結果是選項卡代號列表。window_handles[0]是指選項卡列表中的第1個選項卡。
switch_to.window(選項卡參數)：切換到選項卡參數指定的選項卡。
代碼示例以下：

import time
from selenium import webdriver
browser = webdriver.Chrome()
browser.get('https://www.baidu.com')
browser.execute_script('window.open()')       # 開啓一個新選項卡
print(browser.window_handles)                     # 輸出當前開啓的選項卡
browser.switch_to.window(browser.window_handles[1])      # 切換到新選項卡，也是第2個選項卡
browser.get('https://www.taobao.com')       # 在第2個選項卡中打開淘寶頁面
time.sleep(1)
browser.switch_to.window(browser.window_handles[0])    # 切換到第1個選項卡
browser.get('https://www.sina.com.cn')        # 在第1個選項卡打開新浪頁面
browser.close()                                              # 關閉當前選項卡，也是第1個選項卡

輸出以下所示：
['CDwindow-AAC4839C9E18D601645AC4D868050F5D', 'CDwindow-37138AB8D7A2E7501E48014FB506977C']

1四、異常處理
使用Selenium的時候，可能會遇到訪問超時異常、節點未找到異常等狀況。出現異常程序就中斷運行。爲了不程序中斷執行，可以使用try except語句捕獲各類異常。

使用Selenium時，常遇到的異常是：TimeoutException（超時異常），NoSuchElementException（節點未找到異常），此外還可用
WebDriverException異常捕獲全部由Selenium產生的異常。異常模塊所在位置是：selenium.common.exceptions。

導入WebDriverException的命令：
from selenium.common.exceptions import WebDriverException

Selenium的異常類官方文檔參考：
http://selenium-python.readthedocs.io/api.html#module-selenium.common-exceptionspython