獲取網頁指定內容,終於不用正則表達式.

剛設計一個獲取網頁內中草藥資料提取的軟件,原想找些正則表達式來達到獲取文字資料,試找了些,都是獲取鏈接和鏈接文字的,還有獲取TD間文字的沒試過,不過對照獲取到的網頁內容可見效果不很滿意,於是自己對網頁內容進行分析,經過2天的努力,終於不用正則表達式,獲取到想要的純文字資料,下面是使用語句獲取的一個網頁內容: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0
相關文章
相關標籤/搜索