java網頁爬蟲,多重正則——抓取鏈接並且按自己的格式展示出來

所謂的網頁爬蟲,就是url請求網頁數據,通過正則並獲取自己想要的數據。 我這邊訪問的鏈接是http://www.baixing.com/?changeLocation=yes 本文通過Java請求一個網頁,拿到網頁的文本信息,通過雙重正則,讓網頁中的地理信息與相應鏈接按如下形式展示出來。 寧縣 = ningxian.baixing.com 天水 = tianshui.baixing.com 全天水
相關文章
相關標籤/搜索