解析html時可能會須要某個節點的可見文本,而有時該節點下會嵌套不肯定的多個子/後代節點。html
<?xml version="1.0" encoding="UTF-8"?> <root> <tagA> <field>hello</field> <field><b>world</b></field> </tagA> </root>
取得tagA的可見文件,即"hello world"。函數
先取得tagA的html片斷,再將片斷中的標籤過濾掉。測試
Document doc = Jsoup.parse(input); Elements ele = doc.getElementsByTag("tagA"); System.out.println(ele.text());
使用string函數code
string(arg) 返回參數的字符串值。參數能夠是數字、邏輯值或節點。xml
所需xpath表達式htm
string(//tagA)