使用java正則表達式過濾HTML ,獲取標籤中的內容解決思路

怎麼使用java正則表達式過濾HTML ,獲取<body>標籤中的內容,具體代碼以下:
<body >
<div class="infoEmbedDiv-C">
       <div class="contentBody-C">
           <div class="pic-C">
               <div class="panel-img" style="float: left;">點擊插入圖片</div>
               <div class="panel-img" style="float: right;">點擊插入圖片</div>
           </div>
           <div class="text-C">內容顯示</div>
           <div class="collect">採集</div>
       </div>
</div>
</body>

上面是須要獲取的內容(不包括body標籤)。各位。。。。。。大神。help
------解決思路----------------------
用 jsoup吧
------解決思路----------------------
解析html的用jsoup最方便了
------解決思路----------------------
說一個特簡單的作法,在一個html頁面中,你都知道要取<body></body>之間的部分,先將html頁面內容讀取到字符串中,而後直接使用string的截取,就搞定了。html


PS:還有什麼疑問能夠到http://java.tanzhouedu.net提出 ,也能夠在羣 457036818提出 java

相關文章
相關標籤/搜索