katta項目主頁:http://katta.sourceforge.net/ html
Katta的介紹:http://blog.sina.com.cn/s/blog_43b8e6dd0100ne4b.html java
關於Solr整合Katta的討論https://issues.apache.org/jira/browse/SOLR-1395 apache
1.下載 分佈式
katta:http://sourceforge.net/projects/katta/files/katta/ oop
solr:http://lucene.apache.org/solr/ spa
在上面的討論中彷佛是使用的Lucene4.0,Katta0.6.2 .net
我直接使用 orm
katta:0.6.3 htm
solr:3.6.1 blog
2.分佈式搜索是一個好的解決方案,本身動手開發是有很大難度的.我相信使用Lucene的人不少,而且也不少是直接使用Solr的.能把Lucene的索引文件放到Hadoop HDFS文件系統上我想是一個終極解決方案,可是最終要的是能作索引分片,而且能提供分佈式搜索.Lucene的創始人Doug Cutting 也是建議katta這個解決方案的.見: http://wiki.apache.org/hadoop/DistributedLucene
由於涉及的技術比較多,並且技術門檻也較高,鮮有人整合成功.其中涉及的技術包括:Lucene,Solr,Katta,ZooKeeper,Hadoop RPC.最主要的整合Lucene和Solr必須有較深的實戰經驗.
3.整合
下載Solr3.6.1源碼,solr-core,solrj兩個,下載Katta-0.6.3源碼,katta.zip解壓後在src目錄下已經存在.把這三個導入到Eclipse.如
整理好上面三個項目,而且使其能經過編譯.
再建立一個java項目:如solr-katta-plugin,這個項目依賴於katta,solr-core,solrj.如:
在https://issues.apache.org/jira/browse/SOLR-1395上下載幾個文件,從提交的時間上來看,應該下載我用線條標記了的.在Linux 終端中執行patch -p 0 -i *.patch,[*換成你下載的],當有詢問是輸入enter,或者輸入y等.把源碼解壓出來.這裏我已經OK,須要的讀者能夠發信給我我能夠提供.
全部源碼copy到solr-katta-plugin項目下的src目錄,正常的話會出現很錯誤的.
第一步完成.