之前在作網頁靜態生成的時候,使用正則表達式分析提取網頁連接。最近搜索瞭解到java有個Jsoup解析網頁,對應.net有個nsoup。處理網頁很是好用。java
Document doc = NSoupClient.Parse(str); Elements es = doc.Select("a.link"); foreach (Element e in es) { a=e.Attr("href"); }
具體使用,百度參考Jsoup的手冊就妥了。正則表達式