全文檢索系統技術架構及流程說明

技術架構圖 java 索引的建立 根據文件來源,分爲hadoop數據和oarcle數據兩類。 (1) hadoop數據 在線網盤的文本文件和非文本文件都保存在hadoop的hdfs或hbase數據表中,推薦系統的網頁文件也保存在hbase表中。這些文件經過tika、Jsoup等文本提取或文本解析工具將文件名、文本內容、網頁文字內容等可索引數據解析出來保存在hbase表的對應字段中,而後經過ES-H
相關文章
相關標籤/搜索