WebCollector 網頁爬蟲

爬蟲簡介: WebCollector 是一個無須配置、便於二次開發的 Java 爬蟲框架(內核),它提供精簡的的 API,只需少量代碼即可實現一個功能強大的爬蟲。WebCollector-Hadoop 是 WebCollector 的 Hadoop 版本,支持分佈式爬取。 爬蟲內核: WebCollector 致力於維護一個穩定、可擴的爬蟲內核,便於開發者進行靈活的二次開發。內核具有很強的擴展性,
相關文章
相關標籤/搜索