Nutch2 WebPage寫入數據庫的過程分析

版本: Nutch 2.2.1 本文經過InjectJob來追蹤webpage的定義、建立、傳遞、序列化、寫入數據庫的整個過程。從源碼中摘錄了重要的代碼行,並標明其所在文件名、行號。 1. 定義 schema schema直接寫在源代碼裏面: //file:org/apache/nutch/storage/WebPage.java //line: 42 public class WebPage e
相關文章
相關標籤/搜索