使用xpath取得節點的text

解析html時可能會須要某個節點的可見文本,而有時該節點下會嵌套不肯定的多個子/後代節點。html

測試輸入

<?xml version="1.0" encoding="UTF-8"?>
<root>
	<tagA>
		<field>hello</field>
		<field><b>world</b></field>
	</tagA>
</root>

目標

取得tagA的可見文件,即"hello world"。函數

解決方案

1.折中方案

先取得tagA的html片斷,再將片斷中的標籤過濾掉。測試

2.jsoup

Document doc = Jsoup.parse(input);
      Elements ele = doc.getElementsByTag("tagA");
      System.out.println(ele.text());

3.xpath

使用string函數code

string(arg) 返回參數的字符串值。參數能夠是數字、邏輯值或節點。xml

所需xpath表達式htm

string(//tagA)
相關文章
相關標籤/搜索