Solr/Lucene分佈式搜索,Solr Integrate katta step1

時間 2019-11-25

標籤 solr lucene 分佈式搜索 integrate katta step1 step 欄目系統架構简体版

原文原文鏈接

katta項目主頁:http://katta.sourceforge.net/ html

Katta的介紹:http://blog.sina.com.cn/s/blog_43b8e6dd0100ne4b.html java

關於Solr整合Katta的討論https://issues.apache.org/jira/browse/SOLR-1395 apache

1.下載分佈式

katta:http://sourceforge.net/projects/katta/files/katta/ oop

solr:http://lucene.apache.org/solr/ spa

在上面的討論中彷佛是使用的Lucene4.0,Katta0.6.2 .net

我直接使用 orm

katta:0.6.3 htm

solr:3.6.1 blog

2.分佈式搜索是一個好的解決方案,本身動手開發是有很大難度的.我相信使用Lucene的人不少,而且也不少是直接使用Solr的.能把Lucene的索引文件放到Hadoop HDFS文件系統上我想是一個終極解決方案,可是最終要的是能作索引分片,而且能提供分佈式搜索.Lucene的創始人Doug Cutting 也是建議katta這個解決方案的.見: http://wiki.apache.org/hadoop/DistributedLucene

由於涉及的技術比較多,並且技術門檻也較高,鮮有人整合成功.其中涉及的技術包括:Lucene,Solr,Katta,ZooKeeper,Hadoop RPC.最主要的整合Lucene和Solr必須有較深的實戰經驗.

3.整合

下載Solr3.6.1源碼,solr-core,solrj兩個,下載Katta-0.6.3源碼,katta.zip解壓後在src目錄下已經存在.把這三個導入到Eclipse.如

整理好上面三個項目,而且使其能經過編譯.

再建立一個java項目:如solr-katta-plugin,這個項目依賴於katta,solr-core,solrj.如:

在https://issues.apache.org/jira/browse/SOLR-1395上下載幾個文件,從提交的時間上來看,應該下載我用線條標記了的.在Linux 終端中執行patch -p 0 -i *.patch,[*換成你下載的],當有詢問是輸入enter,或者輸入y等.把源碼解壓出來.這裏我已經OK,須要的讀者能夠發信給我我能夠提供.

全部源碼copy到solr-katta-plugin項目下的src目錄,正常的話會出現很錯誤的.

第一步完成.