怎麼使用java正則表達式過濾HTML ,獲取<body>標籤中的內容,具體代碼以下:
<body >
<div class="infoEmbedDiv-C">
<div class="contentBody-C">
<div class="pic-C">
<div class="panel-img" style="float: left;">點擊插入圖片</div>
<div class="panel-img" style="float: right;">點擊插入圖片</div>
</div>
<div class="text-C">內容顯示</div>
<div class="collect">採集</div>
</div>
</div>
</body>
上面是須要獲取的內容(不包括body標籤)。各位。。。。。。大神。help
------解決思路----------------------
用 jsoup吧
------解決思路----------------------
解析html的用jsoup最方便了
------解決思路----------------------
說一個特簡單的作法,在一個html頁面中,你都知道要取<body></body>之間的部分,先將html頁面內容讀取到字符串中,而後直接使用string的截取,就搞定了。html
PS:還有什麼疑問能夠到http://java.tanzhouedu.net提出 ,也能夠在羣 457036818提出 java