HtmlUnit實現ajax網絡爬蟲

網上關於網絡爬蟲實現方式有不少種,可是不少都不支持Ajax,李兄說:模擬纔是王道。確實,若是可以模擬一個沒有界面的瀏覽器,還有什麼不能作到的呢?關於解析Ajax網站的框架也有很多,我選擇了HtmlUnit,官方網站:http://htmlunit.sourceforge.net/,htmlunit能夠說是一個Java版本的無界面瀏覽器,幾乎無所不能,並且不少東西都封裝得特別完美。這是這幾天來積累
相關文章
相關標籤/搜索