WebFetch 是無依賴極簡網頁爬取組件

時間 2019-12-18

標籤 webfetch 依賴網頁組件欄目設計模式简体版

原文原文鏈接

WebFetch 是無依賴極簡網頁爬取組件，能在移動設備上運行的微型爬蟲。git

WebFetch 要達到的目標：github

使用文檔

WebFetch的使用很是簡單，讓小白用戶快速上手，WebFetch爲用戶配置默認頁面處理方法，默認將抓取到的頁面信息使用System.out.print輸出到控制檯（經過配置PageHandler修改默認操做）。ip

啓動代碼：

WebFetch webFetch = new WebFetch(); 
webFetch.addBeginTask("https://github.com").start();

中止代碼：

webFetch.close();

WebFetch再執行start()方法後不會阻塞程序執行，能夠加入多個網頁地址，目前支持http與https，至少須要一個起始地址。

第一個版本還須要不斷改進與完善，但願你們提出寶貴的改進意見，感謝你們的支持。

聯繫方式：wanghailiang333@qq.com

無依賴極簡網頁爬取組件，能在移動設備上運行的微型爬蟲。

issues:

最近提交:

下載zip master分支代碼最近更新：2015-05-25

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。