[python爬蟲] Selenium常見元素定位方法和操做的學習介紹

        這篇文章主要Selenium+Python自動測試或爬蟲中的常見定位方法、鼠標操做、鍵盤操做介紹,但願該篇基礎性文章對你有所幫助,若是有錯誤或不足之處,請海涵~同時CSDN老是屏蔽這篇文章,再加上最近只能專家和伯樂發表文章至首頁(why),這嚴重影響別人閱讀新人的文章和程序猿的激情,因此想起本身博客園的帳號,感受編輯功能很是不錯啊,之後兩邊都會更新文章。最後記錄此站第一篇文章,但願能分享更多文章於此!
        前文目錄:
        [Python爬蟲] 在Windows下安裝PhantomJS和CasperJS及入門介紹(上)
        [Python爬蟲] 在Windows下安裝PIP+Phantomjs+Selenium
        [Python爬蟲] Selenium自動訪問Firefox和Chrome並實現搜索截圖
        [Python爬蟲] Selenium實現自動登陸163郵箱和Locating Elements介紹
        [Python爬蟲] Selenium+Phantomjs動態獲取CSDN下載資源信息和評論css

一.定位元素方法html

        官網地址:http://selenium-python.readthedocs.org/locating-elements.html
        這裏有各類策略用於定位網頁中的元素(locate elements),你能夠選擇最適合的方案,Selenium提供了一下方法來定義一個頁面中的元素:
java

find_element_by_id
find_element_by_name
find_element_by_xpath
find_element_by_link_text
find_element_by_partial_link_text
find_element_by_tag_name
find_element_by_class_name
find_element_by_css_selector

        下面是查找多個元素(這些方法將返回一個列表):
python

find_elements_by_name
find_elements_by_xpath
find_elements_by_link_text
find_elements_by_partial_link_text
find_elements_by_tag_name
find_elements_by_class_name
find_elements_by_css_selector

        除了上面給出的公共方法,這裏也有兩個在頁面對象定位器有用的私有方法。這兩個私有方法是find_element和find_elements。
        經常使用方法是經過xpath相對路徑進行定位,同時CSS也是比較好的方法。舉例:web

<html>
 <body>
  <form id="loginForm">
   <input name="username" type="text" />
   <input name="password" type="password" />
   <input name="continue" type="submit" value="Login" />
   <input name="continue" type="button" value="Clear" />
  </form>
</body>
<html>

        定位username元素的方法以下:
windows

username = driver.find_element_by_xpath("//form[input/@name='username']")
username = driver.find_element_by_xpath("//form[@id='loginForm']/input[1]")
username = driver.find_element_by_xpath("//input[@name='username']")

        [1] 第一個form元素經過一個input子元素,name屬性和值爲username實現
        [2] 經過id=loginForm值的form元素找到第一個input子元素
        [3] 屬性名爲name且值爲username的第一個input元素api

二.操做元素方法

        在講述完定位對象(locate elements)以後咱們須要對該已定位對象進行操做,一般全部的操做與頁面交互都將經過WebElement接口,常見的操做元素方法以下:
瀏覽器

clear 清除元素的內容
send_keys 模擬按鍵輸入
click 點擊元素
submit 提交表單

        舉例自動訪問FireFox瀏覽器自動登陸163郵箱。dom

from selenium import webdriver  
from selenium.webdriver.common.keys import Keys  
import time

# Login 163 email
driver = webdriver.Firefox()  
driver.get("http://mail.163.com/")

elem_user = driver.find_element_by_name("username")
elem_user.clear
elem_user.send_keys("15201615157")  
elem_pwd = driver.find_element_by_name("password")
elem_pwd.clear
elem_pwd.send_keys("******")  
elem_pwd.send_keys(Keys.RETURN)
#driver.find_element_by_id("loginBtn").click()
#driver.find_element_by_id("loginBtn").submit()
time.sleep(5)  
assert "baidu" in driver.title  
driver.close()  
driver.quit()  

        首先經過name定位用戶名和密碼,再調用方法clear()清除輸入框默認內容,如「請輸入密碼」等提示,經過send_keys("**")輸入正確的用戶名和密碼,最後經過click()點擊登陸按鈕或send_keys(Keys.RETURN)至關於回車登陸,submit()提交表單。
        PS:若是須要輸入中文,防止編碼錯誤使用send_keys(u"中文用戶名")。函數

三.WebElement接口獲取值

        經過WebElement接口能夠獲取經常使用的值,這些值一樣很是重要。

size 獲取元素的尺寸
text 獲取元素的文本
get_attribute(name) 獲取屬性值
location 獲取元素座標,先找到要獲取的元素,再調用該方法
page_source 返回頁面源碼
driver.title 返回頁面標題
current_url 獲取當前頁面的URL
is_displayed() 設置該元素是否可見
is_enabled() 判斷元素是否被使用
is_selected() 判斷元素是否被選中
tag_name 返回元素的tagName

        舉例代碼以下:

from selenium import webdriver  
from selenium.webdriver.common.keys import Keys  
import time

driver = webdriver.PhantomJS(executable_path="G:\phantomjs-1.9.1-windows\phantomjs.exe")   
driver.get("http://www.baidu.com/")

size = driver.find_element_by_name("wd").size
print size
#尺寸: {'width': 500, 'height': 22}

news = driver.find_element_by_xpath("//div[@id='u1']/a[1]").text
print news
#文本: 新聞

href = driver.find_element_by_xpath("//div[@id='u1']/a[2]").get_attribute('href')
name = driver.find_element_by_xpath("//div[@id='u1']/a[2]").get_attribute('name')
print href,name
#屬性值: http://www.hao123.com/ tj_trhao123

location = driver.find_element_by_xpath("//div[@id='u1']/a[3]").location
print location
#座標: {'y': 19, 'x': 498}

print driver.current_url
#當前連接: https://www.baidu.com/
print driver.title
#標題: 百度一下, 你就知道

result = location = driver.find_element_by_id("su").is_displayed()
print result
#是否可見: True

        其中圖片解釋以下圖所示。

四.鼠標操做

        在現實的自動化測試中關於鼠標的操做不只僅是click()單擊操做,還有不少包含在ActionChains類中的操做。以下:

context_click(elem) 右擊鼠標點擊元素elem,另存爲等行爲
double_click(elem) 雙擊鼠標點擊元素elem,地圖web可實現放大功能
drag_and_drop(source,target) 拖動鼠標,源元素按下左鍵移動至目標元素釋放
move_to_element(elem) 鼠標移動到一個元素上
click_and_hold(elem) 按下鼠標左鍵在一個元素上
perform() 在經過調用該函數執行ActionChains中存儲行爲

        舉例以下圖所示,獲取經過鼠標右鍵另存爲百度圖片logo。代碼:

import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.common.action_chains import ActionChains

driver = webdriver.Firefox()
driver.get("http://www.baidu.com")

#鼠標移動至圖片上 右鍵保存圖片
elem_pic = driver.find_element_by_xpath("//div[@id='lg']/img")
print elem_pic.get_attribute("src")
action = ActionChains(driver).move_to_element(elem_pic)
action.context_click(elem_pic)

#重點:當右鍵鼠標點擊鍵盤光標向下則移動至右鍵菜單第一個選項
action.send_keys(Keys.ARROW_DOWN)
time.sleep(3)
action.send_keys('v') #另存爲
action.perform()

#獲取另存爲對話框(失敗)
alert.switch_to_alert()
alert.accept()

        效果以下圖所示,經過xpath定位到圖片位置並右擊鼠標,在彈出的菜單中選擇「另存爲圖片」。可是如何點擊「另存爲對話框」的「保存」按鈕是個難點,目前剛學習階段,境界沒到沒法解決。緣由:
        WebDriver cannot directly interact with dialog windows this is because dialog windows are the domain of the operating system and not the webpage.


        該部分推薦參考資料:
        selenium 右鍵下載圖片,結合sikuli - tobecrazy
        Selenium WebDriver 中鼠標和鍵盤事件分析及擴展
        Selenium Windows Save/Open Open Dialouge - StackOver
        書籍《selenium2 python自動化測試》 做者:蟲師

五.鍵盤操做

        參考:http://selenium-python.readthedocs.org/api.html
        前面講述了鼠標操做,如今講述鍵盤操做。在webdriver的Keys類中提供了鍵盤全部的按鍵操做,固然也包括一些常見的組合鍵操做如Ctrl+A(全選)、Ctrl+C(複製)、Ctrl+V(粘貼)。更多鍵參考官方文檔對應的編碼。

send_keys(Keys.ENTER) 按下回車鍵
send_keys(Keys.TAB) 按下Tab製表鍵
send_keys(Keys.SPACE) 按下空格鍵space
send_keys(Kyes.ESCAPE) 按下回退鍵Esc
send_keys(Keys.BACK_SPACE) 按下刪除鍵BackSpace
send_keys(Keys.SHIFT) 按下shift鍵
send_keys(Keys.CONTROL) 按下Ctrl鍵
send_keys(Keys.ARROW_DOWN) 按下鼠標光標向下按鍵
send_keys(Keys.CONTROL,'a') 組合鍵全選Ctrl+A
send_keys(Keys.CONTROL,'c') 組合鍵複製Ctrl+C
send_keys(Keys.CONTROL,'x') 組合鍵剪切Ctrl+X
send_keys(Keys.CONTROL,'v') 組合鍵粘貼Ctrl+V

        這裏使用的例子參考蟲師的書籍《selenium2 python自動化測試》,推薦該書給你們。代碼仍是很是有意思的,你們本身去感覺下吧~

#coding=utf-8
import time
from selenium import webdriver
from selenium.webdriver.common.keys import Keys

driver = webdriver.Firefox()
driver.get("http://www.baidu.com")

#輸入框輸入內容
elem = driver.find_element_by_id("kw")
elem.send_keys("Eastmount CSDN")
time.sleep(3)

#刪除一個字符CSDN 回退鍵
elem.send_keys(Keys.BACK_SPACE)
elem.send_keys(Keys.BACK_SPACE)
elem.send_keys(Keys.BACK_SPACE)
elem.send_keys(Keys.BACK_SPACE)
time.sleep(3)

#輸入空格+"博客"
elem.send_keys(Keys.SPACE)
elem.send_keys(u"博客")
time.sleep(3)

#ctrl+a 全選輸入框內容
elem.send_keys(Keys.CONTROL,'a')
time.sleep(3)

#ctrl+x 剪切輸入框內容
elem.send_keys(Keys.CONTROL,'x')
time.sleep(3)

#輸入框從新輸入搜索
elem.send_keys(Keys.CONTROL,'v')
time.sleep(3)

#經過回車鍵替代點擊操做
driver.find_element_by_id("su").send_keys(Keys.ENTER)
time.sleep(3)

driver.quit()

        等會晚上7點有個360的筆試,好好準備下吧!最後但願文章對你有所幫助吧,若是有錯誤或不足之處,還請海涵~同時接下來學習下Linux和下面做者的文章。
        http://www.dotblogs.com.tw/larrynung/archive/2012/09/26/75065.aspx
      (By:Eastmount 2015-9-15 下午5點   http://www.cnblogs.com/eastmount/

相關文章
相關標籤/搜索