^ 開頭 '^b.*'----以b開頭的任意字符 $ 結尾 '^b.*3$'----以b開頭,3結尾的任意字符 * 任意長度(次數),≥0 ? 非貪婪模式,非貪婪模式儘量少的匹配所搜索的字符串 '.*?(b.*?b).*'----從左至右第一個b和的二個b之間的內容(包含b) + 一次或屢次 {2} 指定出現次數2次 {2,} 出現次數≥2次 {2,5} 出現次數2≤x≤5 | 或 「z|food」----能匹配「z」或「food」(此處請謹慎)。「[z|f]ood」----則匹配「zood」或「food」或"zood" [] 括號中任意一個符合便可(中括號裏面沒有分轉義字符) '[abc]ooby123'----只要開頭符合[]中任意一個便可 [^] 只要不出現[]的便可 [a-Z] 從小a到大Z . 任意字符 \s 匹配不可見字符 \n \t '你\s好'----能夠匹配‘你 好’ \S 匹配可見字符,即普通字符 \w 匹配下劃線在內的任何單詞字符 \W 和上一個相反 [\u4E00-\u9FA5] 只能匹配漢字
() 要取出的信息就用括號括起來 \d 數字
article 選取全部article元素的全部子節點 /article 選取根元素article article/a 選取全部屬於article的子元素的a元素 //div 選取全部div子元素(不論出如今文檔任何地方) article//div 選取全部屬於article元素的後代的div元素無論它出如今article之下的任何位置 //@class 選取全部名爲class的屬性 /article/div[1] 選取屬於srticle子元素的第一個div全部子節點 /article/div[last()] 選取屬於article子元素的最後一個div全部子節點 /article/div[last()-1] 選取屬於article子元素的倒數第二個div全部子節點 //div[@lang] 選取全部擁有lang屬性的div元素 //div[@lang='eng'] 選取全部lang屬性爲eng的div元素 /div/* 選取屬於div元素的全部子節點 //* 選取全部元素 //div[@*] 選取全部帶屬性的div元素 //div/a | //div/p 選取全部div元素的a個p元素 //span | //ul 選取文檔中的span和ul元素 article/div/p | //span 選取全部屬於article元素的div元素和全部的span元素
* 選取全部節點 #container 選取id爲container的節點 .container 選取全部class包含container的節點 li a 選取全部li下的全部a節點 ul+p 選取ul後面的第一個p元素 div#container > ul 選取id爲container的div的第一個ul子元素 ul ~ p 選取與ul相鄰的全部p元素 a[title] 選取全部有title屬性的a元素 a[href="http://jobbole.com"] 選取全部href屬性爲jobbole.com a[href*="jobole"] 選取全部href屬性包含jobbole的a元素 a[href^="http"] 選取全部href屬性值以http開頭的a元素 a[href$=".jpg"] 選取全部href屬性值以.jpg結尾的a元素 input[type=radio]:checked 選取選中的radio的元素 div:not(#container) 選取全部id非container的div元素 li:nth-child(3) 選取第三個li元素 tr:nth-child(2n) 第偶數個tr元素