jsoup: Java HTML Parser

jsoup  Java HTML Parser

jsoup 是一款Java 的HTML解析器,可直接解析某個URL地址、HTML文本內容。它提供了一套很是省力的API,可經過DOM,CSS以及相似於jQuery的操做方法來取出和操做數據

HTMLParser 過小衆,連官方文檔都太少,中文的更少

不知道jsoup是否是把整個頁面都解析成DOM樹了,若是是這樣可能會有一點點慢,同事說他那個爬新浪頁面的爬蟲項目,用jsoup知足得了客戶需求
jsoup把整個頁面都解析成DOM樹






相關文章
相關標籤/搜索