Lucene多字段搜索

最近在學習Lucene的過程當中遇到了須要多域搜索並排序的問題,在網上找了找,資料不是不少,如今都列出來,又須要的能夠本身認真看看,都是從其餘網站粘貼過來的,因此比較亂,感謝原創的做者們! 
    使用MultiFieldQueryParser類便可。 

示例代碼: javascript

Java代碼     收藏代碼
  1. package com.lucene.search;  
  2.   
  3. import java.io.File;  
  4. import java.io.IOException; 54com.cn  
  5.   
  6. import org.apache.lucene.analysis.standard.StandardAnalyzer;  
  7. import org.apache.lucene.queryParser.MultiFieldQueryParser;  
  8. import org.apache.lucene.search.BooleanClause;  
  9. import org.apache.lucene.search.Hits;  
  10. import org.apache.lucene.search.IndexSearcher;  
  11. import org.apache.lucene.search.Query;  
  12. import org.apache.lucene.store.Directory;  
  13. import org.apache.lucene.store.FSDirectory;  
  14.   
  15. public class Searcher {  
  16.   
  17. feedom.net  
  18.     public static void main(String[] args) throws Exception {  
  19.         File indexDir = new File("C:\\target\\index\\book");  
  20.         if (!indexDir.exists() || !indexDir.isDirectory()) {  
  21.             throw new IOException();  
  22.         }  
  23.         search(indexDir);  
  24.     }  
  25.   
  26.     public static void search(File indexDir) throws Exception {  
  27.   
  28.         Directory fsDir = FSDirectory.getDirectory(indexDir);  
  29.         IndexSearcher searcher = new IndexSearcher(fsDir);  
  30.   
  31.         String[] queries = { "中文版""8*" };  
  32.         String[] fields = { "name""isbn" };  
  33.         BooleanClause.Occur[] clauses = { BooleanClause.Occur.SHOULD, BooleanClause.Occur.SHOULD };  
  34.         Query query = MultiFieldQueryParser.parse(queries, fields, clauses, new StandardAnalyzer());  
  35.   
  36.         Hits hits = searcher.search(query);  
  37.         System.out.println("共有" + searcher.maxDoc() + "條索引,命中" + hits.length() + "條");  
  38.         for (int i = 0; i < hits.length(); i++) {  
  39.             int DocId = hits.id(i);  
  40.             String DocName = hits.doc(i).get("name");  
  41.             String DocIsbn = hits.doc(i).get("isbn");  
  42.             String DocPblDt = hits.doc(i).get("pbl_dt");  
  43.             System.out.println(DocId + ":" + DocName + " ISBN:" + DocIsbn + " PBLDT:" + DocPblDt);  
  44.         }  
  45.     }  
  46. }  



Java代碼     收藏代碼
  1. package com.lucene.search;  
  2.   
  3. import java.io.File;  
  4. import java.io.IOException;  
  5.   
  6. import org.apache.lucene.analysis.standard.StandardAnalyzer;  
  7. import org.apache.lucene.queryParser.MultiFieldQueryParser;  
  8. import org.apache.lucene.search.BooleanClause;  
  9. import org.apache.lucene.search.Hits;  
  10. import org.apache.lucene.search.IndexSearcher;  
  11. import org.apache.lucene.search.Query;  
  12. import org.apache.lucene.store.Directory;  
  13. import org.apache.lucene.store.FSDirectory;  
  14.   
  15. public class Searcher {  
  16.   
  17.     public static void main(String[] args) throws Exception {  
  18.         File indexDir = new File("C:\\target\\index\\book");  
  19.         if (!indexDir.exists() || !indexDir.isDirectory()) {  
  20.             throw new IOException();  
  21.         }  
  22.         search(indexDir);  
  23.     }  
  24.   
  25.     public static void search(File indexDir) throws Exception {  
  26.   
  27.         Directory fsDir = FSDirectory.getDirectory(indexDir);  
  28.         IndexSearcher searcher = new IndexSearcher(fsDir);  
  29.   
  30.    String[] queries = { "中文版""8*" };  
  31.    String[] fields = { "name""isbn" };  
  32.    BooleanClause.Occur[] clauses = { BooleanClause.Occur.SHOULD, BooleanClause.Occur.SHOULD };  
  33.         Query query = MultiFieldQueryParser.parse(queries, fields, clauses, new StandardAnalyzer());  
  34.   
  35.         Hits hits = searcher.search(query);  
  36.         System.out.println("共有" + searcher.maxDoc() + "條索引,命中" + hits.length() + "條");  
  37.         for (int i = 0; i < hits.length(); i++) {  
  38.             int DocId = hits.id(i);  
  39.             String DocName = hits.doc(i).get("name");  
  40.             String DocIsbn = hits.doc(i).get("isbn");  
  41.             String DocPblDt = hits.doc(i).get("pbl_dt");  
  42.             System.out.println(DocId + ":" + DocName + " ISBN:" + DocIsbn + " PBLDT:" + DocPblDt);  
  43.         }  
  44.     }  
  45. }  


注意:BooleanClause.Occur[]數組,它表示多個條件之間的關係: 

BooleanClause.Occur.MUST表示and, feedom.net 

BooleanClause.Occur.MUST_NOT表示not, 54com.cn 

BooleanClause.Occur.SHOULD表示or. 

--------------------------------------------------------------------------------------------------------- 
多個關鍵字直接的關係是或,因此直接使用多域搜索對象查詢出來的結果就是這樣。 
更靈活的控制方式爲: 

java

Java代碼     收藏代碼
  1. BooleanQuery booleanQuery = new BooleanQuery();   
  2.   
  3. QueryParser parser = new QueryParser("title",分詞器);   
  4. Query titleQuery = parser .parser("中國人民共和國");  
  5. booleanQuery.add(titleQuery,....SHOULD);  
  6.   
  7. QueryParser parser = new QueryParser("content",分詞器);   
  8. Query contentQuery = parser .parser("中國人民共和國");  
  9. booleanQuery.add(contentQuery ,....SHOULD);   


-------------------------------------------------------------------------------------------------- web

Java代碼     收藏代碼
  1. package com.lucene.search;  
  2. import org.apache.lucene.analysis.standard.StandardAnalyzer;   
  3. import org.apache.lucene.document.Document;   
  4. import org.apache.lucene.document.Field;  
  5. import org.apache.lucene.index.IndexWriter;  
  6. import org.apache.lucene.queryParser.MultiFieldQueryParser;  
  7. import org.apache.lucene.search.BooleanClause;  
  8. import org.apache.lucene.search.Hits; import org.apache.lucene.search.IndexSearcher;   
  9. import org.apache.lucene.search.MultiSearcher;   
  10. import org.apache.lucene.search.Query;   
  11. public class Multisearcher {   
  12. private static String INDEX_STORE_PATH1 = "C:\\multi\\1"private static String INDEX_STORE_PATH2 = "C:\\multi\\2";   
  13. public static void main(String[] args) throws Exception {   
  14. Multisearcher.multisearcher();   
  15. }   
  16. public static void multisearcher() throws Exception {   
  17. IndexWriter writer = new IndexWriter(INDEX_STORE_PATH1, new StandardAnalyzer(), true);   
  18. writer.setUseCompoundFile(false);   
  19. Document doc1 = new Document();   
  20. Field f1 = new Field("bookname""鋼鐵是怎樣煉成的", Field.Store.YES, Field.Index.TOKENIZED);   
  21. Field f11 = new Field("price""20.5", Field.Store.YES, Field.Index.UN_TOKENIZED);   
  22. doc1.add(f1); doc1.add(f11);   
  23. Document doc2 = new Document();   
  24. Field f2 = new Field("bookname""鋼鐵戰士", Field.Store.YES, Field.Index.TOKENIZED);   
  25. Field f22 = new Field("price""18.4", Field.Store.YES, Field.Index.UN_TOKENIZED);   
  26. doc2.add(f2);   
  27. doc2.add(f22);   
  28. Document doc3 = new Document();   
  29. Field f3 = new Field("bookname""鋼和鐵是兩種不一樣的元素", Field.Store.YES, Field.Index.TOKENIZED);   
  30. Field f33 = new Field("price""7.6", Field.Store.YES, Field.Index.UN_TOKENIZED);   
  31. doc3.add(f3);   
  32. doc3.add(f33);   
  33. writer.addDocument(doc1);   
  34. writer.addDocument(doc2);   
  35. writer.addDocument(doc3);   
  36. writer.close(); //建立第二個索引器;   
  37. IndexWriter writer2 = new IndexWriter(INDEX_STORE_PATH2, new StandardAnalyzer(), true);   
  38. writer2.setUseCompoundFile(false);   
  39. Document doc4 = new Document();   
  40. Field f4 = new Field("bookname""鋼要比鐵有更多的元素", Field.Store.YES, Field.Index.TOKENIZED);   
  41. Field f44 = new Field("price""22.5", Field.Store.YES, Field.Index.UN_TOKENIZED);   
  42. doc4.add(f4); doc4.add(f44);   
  43. Document doc5 = new Document();   
  44. Field f5 = new Field("bookname""鋼和鐵是兩種重要的金屬", Field.Store.YES, Field.Index.TOKENIZED);   
  45. Field f55 = new Field("price""15.9", Field.Store.YES, Field.Index.UN_TOKENIZED);   
  46. doc5.add(f5); doc5.add(f55); Document doc6 = new Document();   
  47. Field f6 = new Field("bookname""鋼鐵是兩種重要的金屬", Field.Store.YES, Field.Index.TOKENIZED);   
  48. Field f66 = new Field("price""19.00", Field.Store.YES, Field.Index.UN_TOKENIZED);   
  49. doc6.add(f6);   
  50. doc6.add(f66);   
  51. writer2.addDocument(doc4);   
  52. writer2.addDocument(doc5);   
  53. writer2.addDocument(doc6);   
  54. writer2.close();   
  55. String query1 = "鋼";   
  56. String query2 = "[10 TO 20]";//注意格式:中括號還有關鍵字TO是大寫的   
  57. String[] queries = { query1, query2 }; //指定兩個域  
  58. Field String field1 = "bookname";   
  59. String field2 = "price";   
  60. String[] fields = { field1, field2 }; //指定查詢字句之間的關係   
  61. BooleanClause.Occur[] clauses = {   
  62. BooleanClause.Occur.MUST, BooleanClause.Occur.MUST   
  63. }; //轉成多域查詢  
  64. MultiFieldQuery Query q = MultiFieldQueryParser.parse(queries, fields, clauses, new StandardAnalyzer()); //打印Query的內容 System.out.println(q.toString()); //建立兩個IndexSearcher,以實如今多個索引目錄進行查詢   
  65. IndexSearcher searcher1 = new IndexSearcher(INDEX_STORE_PATH1);   
  66. IndexSearcher searcher2 = new IndexSearcher(INDEX_STORE_PATH2);   
  67. IndexSearcher[] searchers = { searcher1, searcher2 }; //使用MultiSearcher進行多域搜索   
  68. MultiSearcher searcher = new MultiSearcher(searchers);   
  69. Hits hits = searcher.search(q);   
  70. for (int i = 0; i < hits.length(); i++) {   
  71. System.out.println(hits.doc(i));   
  72. }   
  73. }  
  74. }  


------------------------------------------------------------------------------------------------------------------------------------------ 
默認狀況下,IndexSearcher類的search方法返回查詢結果時,是按文檔的分值排序的,可使用重載的search方法對結果排序 

IndexSearcher.search(Query,Sort); 

new Sort() 和 Sort.RELEVANCE,以及null同樣,採用默認排序,要定義排序字段,方法是將字段傳入Sort對象 apache

Java代碼     收藏代碼
  1. Sort sort = new Sort(String field);  



也能夠對多個字段排序數組

Java代碼     收藏代碼
  1. Sort sort = new Sort(String[] fields);  



例: 

app

Java代碼     收藏代碼
  1. Sort sort = new Sort(new SortField[]{new SortField(「title」),new SortField(「name」)});  
  2.   
  3. Hits hits=searcher.search(query,Sort);  



多字段查找MultiFieldQueryParser 

只在某些Term中查找,不關心在哪一個字段 

dom

Java代碼     收藏代碼
  1. Query query = new MultiFieldQueryParser.parse(「word」,new String[]{「title」,」content」},analyzer);  

//在title和content中找word 

多字段時默認是OR關係,要改變它,使用如下方法: 

學習

Java代碼     收藏代碼
  1. Query query = MultiFieldQueryParser.parse(「word」,new String[]{「title」,」content」},new int[]{MultiFieldQueryParser.REQUIRED_FIELD,MultiFieldQueryParser.PROHIBITED_FIELD},analyzer);  



其中: 

REQUIRED_FIELD 表示該條件必須有 

PROHIBITED_FIELD 表示必須不含 

搜索多個索引文件MultiSearcher 

1)       創建多個索引:使用不一樣的索引目錄,實例化不一樣的IndexWriter 

2)       創建多索引搜索器: 

Searcher[] searchers = new SEARCHER[2]; 

Searchers[0] = new IndexSearcher(dir1); //搜索索引目錄一 

Searchers[1]= new IndexSearcher(dir2);//搜索索引目錄二 

Searcher searcher = new MultiSearcher(serarchers); 

3) 開始查詢:Hits hits = searcher.search(query); 
--------------------------------------------------------------------------------------------------------------------------------------- 網站

Java代碼     收藏代碼
  1. BooleanQuery typeNegativeSearch = new BooleanQuery();  
  2. QueryParser parser = new QueryParser("contents"new Analyzer());  
  3.                 parser.setDefaultOperator(QueryParser.AND_OPERATOR);  
  4.                 query = parser.parse(queryString);  
  5.                 QueryParser parser2 = new QueryParser("adISELL"new Analyzer());    
  6.   
  7.               
  8.                 query2 = parser2.parse("\"2\"");     
  9. QueryParser parser3 = new QueryParser("adISELL"new Analyzer());                 
  10.                 query3 = parser3.parse("\"2\"");                
  11. QueryParser parser4 = new QueryParser("adISELL"new Analyzer());                 
  12.                 query4 = parser4.parse("\"2\"");                
  13. QueryParser parser4 = new QueryParser("adISELL"new Analyzer());                 
  14.                 query4 = parser4.parse("\"2\"");     
  15. 。。。。  
  16.      QueryParser parser..n = new QueryParser("adISELL"new Analyzer());             
  17.   
  18.      
  19.                 query..n = parser..n.parse("\"2\"");     
  20.                    
  21.                 typeNegativeSearch.add(query,Occur.MUST);  
  22.                 typeNegativeSearch.add(query2,Occur.MUST);  
  23. typeNegativeSearch.add(query3,Occur.MUST);  
  24.                 typeNegativeSearch.add(query4,Occur.MUST);  
  25. .....  
  26. typeNegativeSearch.add(query..n,Occur.MUST);  
  27.   
  28. hits = searcher.search(typeNegativeSearch);  



1, 幾種span的querySpanTermQuery:檢索效果徹底同TermQuery,但內部會記錄一些位置信息 

,供SpanQuery的其它API使用,是其它屬於SpanQuery的Query的基礎。 
SpanFirstQuery:查找方式爲從Field的內容起始位置開始,在一個固定的寬度內查找所指定的 

詞條。 
SpanNearQuery:功能相似PharaseQuery。SpanNearQuery查找所匹配的不必定是短語,還有可 

能是另外一個SpanQuery的查詢結果做爲總體考慮,進行嵌套查詢。 
SpanOrQuery:把全部SpanQuery查詢結果綜合起來,做爲檢索結果。 
SpanNotQuery:從第一個SpanQuery查詢結果中,去掉第二個SpanQuery查詢結果,做爲檢索結 

果。 

2, 多條件索引關係 

BooleanClause用於表示布爾查詢子句關係的類,包括:BooleanClause.Occur.MUST, 

BooleanClause.Occur.MUST_NOT,BooleanClause.Occur.SHOULD。有如下6種組合: 
1.MUST和MUST:取得連個查詢子句的交集。 
2.MUST和MUST_NOT:表示查詢結果中不能包含MUST_NOT所對應得查詢子句的檢索結果。 
3.MUST_NOT和MUST_NOT:無心義,檢索無結果。 
4.SHOULD與MUST、SHOULD與MUST_NOT:SHOULD與MUST連用時,無心義,結果爲MUST子句的檢索 

結果。與MUST_NOT連用時,功能同MUST。 
5.SHOULD與SHOULD:表示「或」關係,最終檢索結果爲全部檢索子句的並集。this

相關文章
相關標籤/搜索