selenium--Xpath定位

時間 2020-06-14

原文原文鏈接

前戲

前面介紹過了七種定位方式，今天來介紹最後一種，也是最強大，本人最經常使用的定位方式xpathhtml

Xpath 即爲 xml 路徑語言，它是一種用來肯定 xml 文檔中某部分位置的語言。Xpath 基於 xml 的樹狀結構，提供在數據結構樹中找尋節點的能力，html 也屬於 xml前端

先來看一個簡單的xpath定位web

from selenium import webdriver from time import sleep driver = webdriver.Chrome() driver.get('http://www.baidu.com') sleep(3) driver.find_element_by_xpath('//*[@id="kw"]').send_keys('selenium') # //表示當前頁面,@id="kw" 表示id爲kw了
sleep(2) driver.find_element_by_xpath('//*[@id="su"]').click() sleep(2) driver.quit()

看起來是否是比較麻煩，爲何不經過id直接定位，由於在前端網頁開發中，不是每一個元素都有id屬性的，或者id值是動態變化的。不能直接經過id定位，就要用到xpath定位了數據結構

被測網頁HTML代碼以下：函數

XPath絕對路徑定位

查找第一個div標籤下的「查詢」按鈕測試

 driver.find_element_by_xpath('/html/body/div/inpu[@value="查詢"]')

XPath相對路徑定位

查找第一個div標籤下的「查詢」按鈕 ui

driver.find_element_by_xpath('//input[@value="查詢"]')

//表示從匹配選擇的當前節點開始選擇文檔中的節點，定位到value值爲查詢的input頁面，使用@代表後面接的是屬性spa

使用索引號定位元素

查找第一個div標籤下的「查詢」按鈕 3d

driver.find_element_by_xpath('//input[2]')

定位到第二個input標籤，從1開始code

使用頁面元素的屬性值定位元素

定位被測試網頁中的第一張img元素

//img[@href='http://www.baidu.com'] //input[@type='button']

使用模糊屬性值定位元素

頁面上某些元素的屬性值是動態生成的，也就是說每次訪問的屬性值都不同，使用模糊屬性值能夠解決一部分此類問題，前提是屬性中有一部份內容保持不變

查找屬性alt的屬性值以「div1」關鍵字開始的頁面元素

//img[starts-with(@alt,'div1')]

查找alt屬性的屬性值包含「img」關鍵字的頁面元素，只要包含便可，無須考慮位置

//img[contains(@alt,'img')]

實例：

上面頁面中id值中後面的數字是動態變化的

fr = driver.find_element_by_xpath("//iframe[contains(@id,'x-URS-iframe')]")
driver.switch_to.frame(fr)

使用XPath軸（Axes）定位元素

先找到一個相對好定位的元素，讓他做爲軸，根據他和要定位的相對位置關係進行定位

XPath軸關鍵字	軸的含義說明	定位表達式實例	表達式解釋
parent	選擇當前節點的上層父節點	//img[@alt='div2-img2']/parent::div	查找到屬性alt的屬性值爲div2-img2的img元素並基於該img元素的位置找到他上一級的div元素
child	選擇當前節點的下層全部子節點	//div[@id='div1']/child::img	查找到id屬性值爲div1的div元素，並基於該div 元素的位置找到他下層節點中的img元素
ancestor	選擇當前節點全部上層的節點	//img[@alt='div2-img2']/ancestor::div	查找到屬性alt的屬性值爲div2-img2的img元素並基於該img元素的位置找到他上一級的div元素
descendant	選擇當前節點全部下層的節點（子，孫等）	//div[@name='div2']descendant::img	查找到屬性name的屬性值爲div2的div元素並基於該元素的位置找到他下級全部節點中的img頁面元素
following	選擇在當前節點以後顯示的全部節點	//div[@id='div1']/following::img	查找到id屬性值爲div1的div元素，並基於該div 元素的位置找到他後面節點中的img元素
following-sibling	選擇當前節點後續全部兄弟節點	//a[@href='http://www.sogou.com']/following-sibling::input	查找到連接地址爲 http://www.sogou.com的連接頁面元素a，並基於連接的位置找到它後續兄弟節點中的input頁面元素
preceding	選擇當前節點前面的全部節點	//img[@alt='div2-img2']/preceding::div	查找到屬性alt的屬性值爲div2-img2的圖片元素img，並基於該圖片元素的位置找到他前面節點中的div頁面元素
preceding-sibling	選擇當前節點前面的全部兄弟節點	//input[@value='查詢']/preceding-sibling::a[1]	查找到value屬性值爲「查詢」的輸入框頁面元素，並基於該輸入框的位置找到它前面同級節點中的第一個連接元素

有時候咱們會在軸後面加一個星號（*），表示通配符，好比//input[@value='查詢']/preceding-sibling::*，它表示查找屬性value的值爲「查詢」的輸入框input元素前面全部的同級元素，但不包括input元素自己

使用頁面元素的文本定位元素

經過text()函數能夠定位到元素文本包含某些關鍵字的頁面元素

(1) //a[text()='搜狗搜索'] (2) //a[.='搜狗搜索'] (3) //a[contain(.,"百度")] (4) //a[contain(text(),"百度")] (5) //a[contain(text(),"百度")]/preceding::div (6) //a[contain(.,"百度")]/..

pytho定位語句

driver.find_element_by_xpath("//a[text()='搜狗搜索']") driver.find_element_by_xpath('//a[contain(text(),"百度")]/preceding::div')

表達式1和表達式2等價，都是查找文本內容爲「搜狗搜索」的連接頁面元素，使用的是精準定位，不能多也不能少

表達式3和表達式4等價，都是查找文本內容裏包含「百度」關鍵字的連接頁面，使用的是模糊匹配

表達式5和表達式6等價，都是查找文本內容裏包含「百度」關鍵字的連接頁面元素a的上層父元素div，表達式6最後使用了兩個點，它表示選取當前節點的父節點，等價於preceding::div

xpath定位實例

實例一

先定位到name='wd'的標籤上，..返回父級標籤，也就是span標籤，在找到span標籤的a標籤

實例二

//*[contains(@id,"cjm_dialog")]/div/div[2]/button[1]/span

實例三

//div[@class="hidden-columns"]/following-sibling::div[4]/div/table/tbody/tr[1]/td[12]/div/button[5]/span

實例四

//span[@class='el-input__suffix']/preceding-sibling::input[1]

實例五

//div[text()="溯源節點"]/../div/button/span/i

實例六

//label[text()="選項名稱"]/following::div/div/input

實例七

//label[contains(text(),"單選1")]/following-sibling::div/div/div/input

實例八

//span[text()="所屬機構"]/../following-sibling::div/span/input

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。