Web 爬蟲 Apache Nutch 1.15 發佈,支持 Java 10

Apache Nutch 1.15 已發佈。Nutch是一個成熟的、可用於生產的 Web 爬蟲。 Nutch 1.x 可以依靠 Apache Hadoop™ 數據結構進行細粒度配置,這對於批處理非常有用。 Nutch是一個由Java實 現的,開放源代碼(open-source)的web搜索引擎。主要用於收集網頁數據,然後對其進行分析,建立索引,以提供相應的接口來對其網頁數據進行 查詢的一套工具。其
相關文章
相關標籤/搜索