Java網絡爬蟲抓取新浪微博我的微博記錄

在正題以前,先了解一下java下抓取網頁上特定內容的方法,也就是所謂的網絡爬蟲,在本文中只會涉及簡單的文字信息與連接爬取。java中訪問http的方式不外乎兩種,一種是使用原生態的httpconnection,還有一種是使用封裝好的插件或框架,如httpclient,okHttp等。在測試爬取網頁信息的過程當中,本人是使用的jsoup工具,由於該工具不單單封裝了http訪問,還有強大的html解析
相關文章
相關標籤/搜索