用XPath精肯定位節點元素&selenium使用Xpath定位之完整篇

在利用XSL進行轉換的過程當中,匹配的概念很是重要。在模板聲明語句 xsl:template match = ""和模板應用語句xsl:apply-templates select = "" 中,用引號括起來的部分必須可以精確地定位節點。具體的定位方法則在XPath中給出。html

之因此要在XSL中引入XPath的概念,目的就是爲了在匹配XML文檔結構樹時可以準確地找到某一個節點元素。能夠把XPath比做文件管理路 徑:經過文件管理路徑,能夠按照必定的規則查找到所須要的文件;一樣,依據XPath所制定的規則,也能夠很方便地找到XML結構文檔樹中的任何一個節 點,顯然這對XSLT來講是一個最最基本的功能。node

XPath數據類型sql

XPath可分爲四種數據類型:編程

  • 節點集(node-set) 
    節點集是經過路徑匹配返回的符合條件的一組節點的集合。其它類型的數據不能轉換爲節點集。
  • 布爾值(boolean) 
    由函數或布爾表達式返回的條件匹配值,與通常語言中的布爾值相同,有true和 false兩個值。布爾值能夠和數值類型、字符串類型相互轉換。
  • 字符串(string) 
    字符串即包含一系列字符的集合,XPath中提供了一系列的字符串函數。字符串可與數值類型、布爾值類型的數據相互轉換。
  • 數值(number) 
    在XPath 中數值爲浮點數,能夠是雙精度64位浮點數。另外包括一些數值的特殊描述,如非數值NaN(Not-a-Number)、正無窮大infinity、負無 窮大-infinity、正負0等等。number的整數值能夠經過函數取得,另外,數值也能夠和布爾類型、字符串類型相互轉換。

其中後三種數據類型與其它編程語言中相應的數據類型差很少,只是第一種數據類型是XML文檔樹的特有產物。app

XPath節點類型編程語言

另外,因爲XPath包含的是對文檔結構樹的一系列操做,所以搞清楚XPath節點類型也是很必要的。回憶一下第二章中講到的XML文檔的邏輯結 構,一個XML文件能夠包含元素、CDATA、註釋、處理指令等邏輯要素,其中元素還能夠包含屬性,並能夠利用屬性來定義命名空間。相應地,在XPath 中,將節點劃分爲七種節點類型:函數

  1. 根節點(Root Node) 
    根節點是一棵樹的最上層,根節點是惟一的。樹上其它全部元素節點都是它的子節點或後代節點。對根節點的處理機制與其它節點相同。在XSLT中對樹的匹配老是先從根節點開始。
  2. 元素節點(Element Nodes) 
    元素節點對應於文檔中的每個元素,一個元素節點的子節點能夠是元素節點、註釋節點、處理指令節點和文本節點。能夠爲元素節點定義一個惟一的標識id。元素節點均可以有擴展名,它是由兩部分組成的:一部分是命名空間URI,另外一部分是本地的命名。
  3. 文本節點(Text Nodes) 
    文本節點包含了一組字符數據,即CDATA中包含的字符。任何一個文本節點都不會有緊鄰的兄弟文本節點,並且文本節點沒有擴展名。
  4. 屬性節點(Attribute Nodes) 
    每 一個元素節點有一個相關聯的屬性節點集合,元素是每一個屬性節點的父節點,但屬性節點卻不是其父元素的子節點。這就是說,經過查找元素的子節點能夠匹配出元 素的屬性節點,但反過來不成立,只是單向的。再有,元素的屬性節點沒有共享性,也就是說不一樣的元素節點不共有同一個屬性節點。 
    對缺省屬性的處理等同於定義了的屬性。若是一個屬性是在DTD聲明的,但聲明爲 #IMPLIED,而該屬性沒有在元素中定義,則該元素的屬性節點集中不包含該屬性。 
    此外,與屬性相對應的屬性節點都沒有命名空間的聲明。命名空間屬性對應着另外一種類型的節點。
  5. 命名空間節點(Namespace Nodes) 
    每個元素節點都有一個相關的命名空間節點集。在XML文檔中,命名空間是經過保留屬性聲明的,所以,在XPath中,該類節點與屬性節點極爲類似,它們與父元素之間的關係是單向的,而且不具備共享性。
  6. 處理指令節點(Processing Instruction Nodes) 
    處理指令節點對應於XML文檔中的每一條處理指令。它也有擴展名,擴展名的本地命名指向處理對象,而命名空間部分爲空。
  7. 註釋節點(Comment Nodes) 
    註釋節點對應於文檔中的註釋。

一個XML文檔樹ui

咱們來構造一棵XML文檔樹,做爲後面舉例的依託:spa


<A id="a1">
<B id="b1">
<C id="c1">
<B name="b"/>
<D id="d1"/>
<E id="e1"/>
<F id="e2"/>
</C>
</B>
<B id="b2"/>
<C id="c2">
<B/>
<D id="d2"/>
<F/>
</C>
<E/>
</A>

如下將要介紹一些XPath中節點匹配的基本方法。翻譯

路徑匹配

路徑匹配與文件路徑的表示相仿,比較好理解。有如下幾個符號:

(1)用「/」指示節點路徑 
如「/A/C/D」 表示節點"A"的子節點"C"的子節點"D",即id值爲d2的D節點, 「/」表示根節點。

(2)用「//」 表示全部路徑以"//"後指定的子路徑結尾的元素 
如「//E」 表示全部E元素,結果是全部三個E元素,如「//C/E」表示全部父節點爲C的E元素,結果是id值爲e1和e2的兩個E元素 。

(3)用「*」 表示路徑的通配符 
如「/A/B/C/*」表示 A元素→B元素→C元素下的全部子元素,即name值爲b的B元素、 id值爲d1的D元素和id值爲e1和e2的兩個E元素 
「/*/*/D」表示上面有兩級節點的D元素,匹配結果是id值爲d2的D元素 ,如「//*」表示全部的元素。

位置匹配

對於每個元素,它的各個子元素是有序的。

如:/A/B/C[1]表示A元素→B元素→C元素的第一個子元素,獲得name值爲b的B元素

/A/B/C[last()]表示A元素→B元素→C元素的最後一個子元素,獲得id值爲e2的E元素

/A/B/C[position()>1]表示A元素→B元素→C元素之下的位置號大於1的元素,獲得id值爲d1的D元素和兩個具備id值的E元素

屬性及屬性值

在XPath中能夠利用屬性及屬性值來匹配元素,要注意的是,元素的屬性名前要有"@"前綴。例如:

//B[@id]表示全部具備屬性id的B元素,結果爲id值爲b1和b2的兩個B元素

//B[@*]表示全部具備屬性的B元素,結果爲兩個具備id屬性的B元素和一個具備name屬性B元素

//B[not(@*)]表示全部不具備屬性的B元素,結果爲A元素→C元素下的B元素

//B[@id="b1"] id值爲b1的B元素,結果爲A元素下的B元素

親屬關係匹配

XML文檔可歸結爲樹型結構,所以任何一個節點都不是孤立的。一般咱們把節點之間的歸屬關係歸結爲一種親屬關係,如父親、孩子、祖先、後代、兄弟等等。在對元素進行匹配時,一樣能夠用到這些概念。例如:

//E/parent::* 表示全部E節點的父節點元素,結果爲id值爲a1的A元素和id值爲c1的C元素

//F/ancestor::* 表示全部F元素的祖先節點元素,結果爲id值爲a1的A元素和id值爲c2的C元素

/A/child::* 表示A的子元素,結果爲id值爲b一、b2的B元素,id值爲c2的C元素,以及沒有任何屬性的E元素

/A/descendant::* 表示A的全部後代元素,結果爲除A元素之外的全部其它元素

//F/self::* 表示全部F的自身元素,結果爲F元素自己

//F/ancestor-or-self::* 表示全部F元素及它的祖先節點元素,結果爲F元素、F元素的父節點C元素和A元素

/A/C/descendant-or-self::* 表示全部A元素→C元素及它們的後代元素,結果爲id值爲c2的C元素、該元素的子元素B、D、F元素

/A/C/following-sibling::* 表示A元素→C元素的緊鄰的後序全部兄弟節點元素,結果爲沒有任何屬性的E元素

/A/C/preceding-sibling::* 表示A元素→C元素的緊鄰的前面全部兄弟節點元素,結果爲id值爲b1和b2的兩個B元素

/A/B/C/following::* 表示A元素→B元素→C元素的後序的全部元素,結果爲id 爲b2的B元素、無屬性的C元素、無屬性的B元素、id爲d2的D元素、無屬性的F元素、/無屬性的E元素。

/A/C/preceding::* 表示A元素→C元素的前面的全部元素,結果爲id爲b2的B元素、id爲e2的E元素、id爲e1的E元素、id爲d1的D元素、name爲 b的B元素、id爲c1的C元素、id爲b1的B元素

條件匹配

條件匹配就是利用一些函數的運算結果的布爾值來匹配符合條件的節點。經常使用於條件匹配的函數有四大類:節點函數、字符串函數、數值函數、布爾函數。例如last()、position()等等,這裏咱們就再也不贅述。

以上這些匹配方法中,用得最多的還要數路徑匹配。在上一章樣式表的例子中,不管是在語 句<xsl:template match="學生花名冊">中,仍是在語句 <xsl:value-of select="名字"/>中,都是依靠給出相對於當前路徑的子路徑來定位節點的。
_______________________________________________________

4.XPath的語法 

咱們在前面已經提到過,XPath是用來幫助XSLT在XML源文檔中查找定位信息的語言。在實際使用過程 中,XPath和XSLT老是混在一塊兒使用,在上面一章的語法例子中咱們已經有使用到XPath的語法,只是沒有明確點出。但W3C將它們分紅兩個標準, 因此咱們也將它們拆成兩章來說解。 

4.XPath的語法 

4.1 當前位置 
4.2 尋址操做 
4.3 運算符 
4.4 功能函數 

4.1 當前位置 

當 咱們使用XSLT處理XML源文檔是,咱們用Context來表示當前正在被模板處理的節點位置。好比xsl:template match="/"語句中表示Context在文檔的根(root)節點。我不知道如何準確的翻譯Context這個詞,它相似於C語言裏的指針,表示程 序當前運行的位置。理解Context對於正確處理XSL模板很是重要,當您的XSL模板輸出的文檔和您想要的不同,最早應該分析的就是Context 在哪裏。
Location Paths是用於設定你想要尋找的Context節點位置。就相似DOS的目錄命令。咱們看個例子

<xsl:for-each select="child::PEOPLE/descendant::PERSON"> 

其中child::PEOPLE/descendant::PERSON就是XPath語法,這個表達式就是一個Location Paths,代碼說明要顯示全部PEOPLE元素的子元素和全部PERSON元素的子元素。一般咱們會採用更簡單的寫法:

<xsl:for-each select="PEOPLE//PERSON"> 

咱們來解釋path的兩種表示方法:"/"和"//"。
"/"是表示當前文檔的節點,相似DOS目錄分割符。例如:/PEOPLE表示選擇根節點下的PEOPLE元素;PEOPLE/PERSON表示選擇PEOPLE元素下全部的PESON子元素。
"//"則表示當前文檔全部的節點。相似查看整個目錄。例如://PEOPLE表示選擇文檔中全部的PEOPLE元素,不管它在什麼層次;PEOPLE//PERSON表示在PEOPLE元素下全部的PERSON元素,不管它的層次多深。

4.2 尋址操做 

Axis和Predicate是XPath語法中對Location Paths進行定位操做的語法,具體的用法列表以下

Axis語法表
--------------------------------------------------------
表達式 簡寫 說明
--------------------------------------------------------
self . 選擇當前的節點.。
例子 :
<TD><xsl:value-of select="."/></TD>
代碼表示在當前位置插入當前的節點包含的文本(text)值,
--------------------------------------------------------
parent .. 選擇當前節點的父節點。 
--------------------------------------------------------
attribute @ 選擇一個元素的全部屬性。 
例子:
<TD><xsl:value-of select="@PERSONID"/></TD>
選擇PERSON元素的全部屬性.
--------------------------------------------------------
child 選擇當前節點的全部子元素。
--------------------------------------------------------
ancestor 選擇當前節點的全部父元素(包括父元素的父元素,類推)
--------------------------------------------------------

Axis幫助咱們選擇當前節點周圍全部的節點,而Predicate則用來定位當前節點內部的元素。表示方法爲方括號[]中加表達式:[ Expression ]。具體舉例以下:

PERSON[position()=2] 
這句代碼表示尋找第二個"PERSON" 元素

PERSON[starts-with(name, "B")] 
這句代碼表示尋找全部名稱以"B"開頭的PERSON元素。 

4.3 運算符 

這一節介紹XPath的運算符(Expressions),列表以下:
--------------------------------------------------------
運算符 說明
--------------------------------------------------------
and, or 就是普通意義的and, or 
--------------------------------------------------------
= 等於
--------------------------------------------------------
!= 不等於
--------------------------------------------------------
>, >= 大於,大於等於
--------------------------------------------------------
<, <= 小於,小於等於。注意:在XSL文件中,<符號要用< 表示
--------------------------------------------------------
+, -, *, div 加減乘除 
--------------------------------------------------------
mod 取模
--------------------------------------------------------
| 兩個節點一塊兒計算
--------------------------------------------------------

________________________________________________________________

selenium使用Xpath定位之完整篇

其中有一片文章提到了xpath元素定位,可是該文章中有些並不能適應一些特殊與個性化的場景。在文本中提供xpath元素的定位終極篇,你必定能在這裏找到你須要的解決辦法。

第一種方法:經過絕對路徑作定位(相信你們不會使用這種方式)

By.xpath("html/body/div/form/input")
By.xpath("//input")
第三種方法:經過元素索引定位
By.xpath("//input[4]")
第四種方法:使用xpath屬性定位(結合第二、第3中方法可使用)
By.xpath("//input[@id='kw1']")
By.xpath("//input[@type='name' and @name='kw1']")
第五種方法:使用部分屬性值匹配(最強大的方法)
By.xpath("//input[start-with(@id,'nice')
By.xpath("//input[ends-with(@id,'很漂亮')
By.xpath("//input[contains(@id,'那麼美')]")

 

本文轉自:

http://www.cnblogs.com/sqlnew/archive/2006/08/17/479869.aspx

http://www.tuicool.com/articles/nI7R7bf

相關文章
相關標籤/搜索