Lucene

核心示例代碼:java

 1 package xyz.zerone.lucene.pojo;
 2 
 3 public class Book {
 4     private Integer id;
 5     private String name;
 6     private Float price;
 7     private String pic;
 8     private String description;
 9     public Integer getId() {
10         return id;
11     }
12     public void setId(Integer id) {
13         this.id = id;
14     }
15     public String getName() {
16         return name;
17     }
18     public void setName(String name) {
19         this.name = name;
20     }
21     public Float getPrice() {
22         return price;
23     }
24     public void setPrice(Float price) {
25         this.price = price;
26     }
27     public String getPic() {
28         return pic;
29     }
30     public void setPic(String pic) {
31         this.pic = pic;
32     }
33     public String getDescription() {
34         return description;
35     }
36     public void setDescription(String description) {
37         this.description = description;
38     }
39     @Override
40     public String toString() {
41         return "Book [id=" + id + ", name=" + name + ", price=" + price + ", pic=" + pic + ", description="
42                 + description + "]";
43     }
44     
45 }

 1 package xyz.zerone.lucene.dao;
 2 
 3 import java.sql.Connection;
 4 import java.sql.DriverManager;
 5 import java.sql.ResultSet;
 6 import java.util.ArrayList;
 7 import java.util.List;
 8 import java.sql.PreparedStatement;
 9 
10 
11 import xyz.zerone.lucene.pojo.Book;
12 
13 public class BookDaoImp implements BookDao {
14     private static String sql = "select * from book";
15 
16     @Override
17     public List<Book> findBookAll() throws Exception {
18         Connection connection = null;
19         PreparedStatement preparedStatement = null;
20         ResultSet resultSet = null;
21         List<Book> list = new ArrayList<Book>();
22         try {
23             Class.forName("com.mysql.jdbc.Driver");
24             connection = DriverManager.getConnection("jdbc:mysql://192.168.3.8:3306/lucenedb", "root", "123456");
25             preparedStatement = connection.prepareStatement(sql);
26             ResultSet rs = preparedStatement.executeQuery();
27             while (rs.next()) {
28                 Book book = new Book();
29                 book.setId(rs.getInt("id"));
30                 book.setName(rs.getString("name"));
31                 book.setPrice(rs.getFloat("price"));
32                 book.setPic(rs.getString("pic"));
33                 book.setDescription(rs.getString("description"));
34                 list.add(book);
35             }
36         } catch (Exception e) {
37             e.printStackTrace();
38         }
39         return list;
40     }
41 
42 }

  1 package xyz.zerone.lucene.first;
  2 
  3 import java.io.File;
  4 import java.io.IOException;
  5 import java.util.ArrayList;
  6 import java.util.List;
  7 
  8 import org.apache.lucene.analysis.Analyzer;
  9 import org.apache.lucene.analysis.standard.StandardAnalyzer;
 10 import org.apache.lucene.document.Document;
 11 import org.apache.lucene.document.Field.Store;
 12 import org.apache.lucene.index.IndexReader;
 13 import org.apache.lucene.index.IndexWriter;
 14 import org.apache.lucene.index.IndexWriterConfig;
 15 import org.apache.lucene.queryparser.classic.ParseException;
 16 import org.apache.lucene.queryparser.classic.QueryParser;
 17 import org.apache.lucene.search.IndexSearcher;
 18 import org.apache.lucene.search.Query;
 19 import org.apache.lucene.search.ScoreDoc;
 20 import org.apache.lucene.search.TopDocs;
 21 import org.apache.lucene.document.FloatField;
 22 import org.apache.lucene.document.StoredField;
 23 import org.apache.lucene.document.StringField;
 24 import org.apache.lucene.document.TextField;
 25 import org.apache.lucene.store.Directory;
 26 import org.apache.lucene.store.FSDirectory;
 27 import org.apache.lucene.util.Version;
 28 import org.apache.lucene.index.Term;
 29 import org.junit.Test;
 30 
 31 import xyz.zerone.lucene.dao.BookDaoImp;
 32 import xyz.zerone.lucene.pojo.Book;
 33 
 34 public class LuceneCore {
 35     // 建立索引庫生成到指定目錄中
 36     @Test
 37     public void createIndexFromDb() throws Exception {
 38         // 定義List存儲document
 39         List<Document> docs = new ArrayList<Document>();
 40         // 從數據庫獲取book表的集合數據
 41         List<Book> bookList = new BookDaoImp().findBookAll();
 42         for (Book book : bookList) {
 43             // 建立Document
 44             Document doc = new Document();
 45             // 建立Field域
 46             // -建立book表字段id的field域
 47             // --參數:域名、域中的value值、是否存儲到文件系統
 48             /**
 49              * 根據實際的需求: 這裏的Field屬性設置能夠有三種(是否分詞、是否索引、是否存儲); 詳見createAutoIndexDate();
 50              */
 51             TextField id = new TextField("id", book.getId().toString(), Store.YES);
 52             TextField name = new TextField("name", book.getName(), Store.YES);
 53             FloatField price = new FloatField("price", book.getPrice(), Store.YES);
 54             TextField pic = new TextField("pic", book.getPic(), Store.YES);
 55             TextField description = new TextField("description", book.getDescription(), Store.YES);
 56             // 將field域加入到documet中
 57             doc.add(id);
 58             doc.add(name);
 59             doc.add(price);
 60             doc.add(pic);
 61             doc.add(description);
 62             // 將document加入集合
 63             docs.add(doc);
 64         }
 65         // 建立一個標準的分詞器
 66         Analyzer analyzer = new StandardAnalyzer();
 67         // 建立索引目錄的流對象,指定索引庫存放位置
 68         Directory d = FSDirectory.open(new File("C:\\Users\\dangxiaopeng\\Desktop\\LuceneIndexData"));
 69         // IndexWriter配置對象
 70         // 參數:lucene版本、分詞器
 71         IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);
 72         // 建立索引操做對象,提供了不少方法操做索引文件(添加、修改、刪除)
 73         IndexWriter indexWriter = new IndexWriter(d, conf);
 74         // 經過indexWriter建立索引
 75         for (Document doc : docs) {
 76             indexWriter.addDocument(doc);
 77         }
 78         indexWriter.commit();
 79         indexWriter.close();
 80     }
 81 
 82     // 根據實際需求建立索引庫生成到指定目錄中
 83     @Test
 84     public void createAutoIndexFromDb() throws Exception {
 85         // 定義List存儲document
 86         List<Document> docs = new ArrayList<Document>();
 87         // 從數據庫獲取book表的集合數據
 88         List<Book> bookList = new BookDaoImp().findBookAll();
 89         for (Book book : bookList) {
 90             // 建立Document
 91             Document doc = new Document();
 92             // 建立Field域
 93             // -建立book表字段id的field域
 94             // --參數:域名、域中的value值、是否存儲到文件系統
 95             // 圖書id,不要分詞,要索引,要存儲
 96             StringField id = new StringField("id", book.getId().toString(), Store.YES);
 97             // 圖書名稱,要分詞,要索引,要存儲
 98             TextField name = new TextField("name", book.getName(), Store.YES);
 99             // 圖書價格,要分詞(Lucene須要的對價格數字特殊處理分詞,以便處理範圍查詢),要索引,要存儲
100             FloatField price = new FloatField("price", book.getPrice(), Store.YES);
101             // 圖書圖片,不要分詞,不要索引,要存儲
102             StoredField pic = new StoredField("pic", book.getPic());
103             // 圖書描述,要分詞,要索引,不要存儲
104             TextField description = new TextField("description", book.getDescription(), Store.YES);
105             // 將field域加入到documet中
106             doc.add(id);
107             doc.add(name);
108             doc.add(price);
109             doc.add(pic);
110             doc.add(description);
111             // 將document加入集合
112             docs.add(doc);
113         }
114         // 建立一個標準的分詞器
115         Analyzer analyzer = new StandardAnalyzer();
116         // 建立索引目錄的流對象,指定索引庫存放位置
117         Directory d = FSDirectory.open(new File("C:\\Users\\dangxiaopeng\\Desktop\\LuceneIndexData"));
118         // IndexWriter配置對象
119         // 參數:lucene版本、分詞器
120         IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);
121         // 建立索引操做對象,提供了不少方法操做索引文件(添加、修改、刪除)
122         IndexWriter indexWriter = new IndexWriter(d, conf);
123         // 經過indexWriter建立索引
124         for (Document doc : docs) {
125             indexWriter.addDocument(doc);
126         }
127         indexWriter.commit();
128         indexWriter.close();
129     }
130 
131     // 刪除索引
132     @Test
133     public void deleteIndex() throws IOException, ParseException {
134 
135         // 調用indexWriter中刪除索引方法
136 
137         // 建立分詞器
138         Analyzer analyzer = new StandardAnalyzer();
139 
140         // 建立索引目錄 的流對象,指定索引目錄 的位置
141         Directory d = FSDirectory.open(new File("C:\\Users\\dangxiaopeng\\Desktop\\LuceneIndexData"));
142 
143         // IndexWriter配置對象
144         // 參數:lucene的版本,分詞器
145         IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);
146 
147         // 建立indexWriter
148         IndexWriter indexWriter = new IndexWriter(d, conf);
149 
150         // 刪除所有索引
151         // indexWriter.deleteAll();
152 
153         // 查詢分析器
154         // 第一個參數:指定默認搜索的域,第二個:分詞器
155         QueryParser queryParser = new QueryParser("description", analyzer);
156 
157         // 建立查詢對象
158         Query query = queryParser.parse("description:java");
159         // 刪除符合條件的索引,刪除符合query查詢的全部document
160         indexWriter.deleteDocuments(query);
161         // 提交
162         indexWriter.commit();
163         // 關閉資源
164         indexWriter.close();
165 
166     }
167 
168     // 更新索引
169     @Test
170     public void updateIndex() throws IOException {
171         // 調用indexWriter中更新索引方法
172         // 建立分詞器
173         Analyzer analyzer = new StandardAnalyzer();
174 
175         // 建立索引目錄 的流對象,指定索引目錄 的位置
176         Directory d = FSDirectory.open(new File("C:\\Users\\dangxiaopeng\\Desktop\\LuceneIndexData"));
177 
178         // IndexWriter配置對象
179         // 參數:lucene的版本,分詞器
180         IndexWriterConfig conf = new IndexWriterConfig(Version.LUCENE_4_10_3, analyzer);
181 
182         // 建立indexWriter
183         IndexWriter indexWriter = new IndexWriter(d, conf);
184 
185         // 建立一個term做爲查詢條件
186         // 參數:field域名稱,值
187         Term term = new Term("id", "1");
188 
189         // 建立document,新的document,替換id等的1的document
190         Document doc = new Document();
191         // 圖書id,不要分詞,要索引、要存儲
192         StringField id = new StringField("id", "1".toString(), Store.YES);
193 
194         // 圖書名稱:要分詞,要索引,要存儲
195         TextField name = new TextField("name", "java編程思想第三版", Store.YES);
196 
197         doc.add(id);
198         doc.add(name);
199 
200         // 更新思路:根據term的信息查詢document,找到以後刪除document,添加doc中的添加到索引庫
201         // 總之:先查詢、再刪除、再添加,建議根據主鍵field查詢document。
202         indexWriter.updateDocument(term, doc);
203         // 提交
204         indexWriter.commit();
205         // 關閉資源
206         indexWriter.close();
207     }
208 
209     // 搜索索引
210     @Test
211     public void searchIndex() throws ParseException, IOException {
212         // 分詞,搜索過程使用的分詞器要和建立索引時使用的分詞器一致
213         Analyzer analyzer = new StandardAnalyzer();
214         // 查詢分析器
215         // 參數:指定默認搜索field域、分詞器
216         QueryParser queryParser = new QueryParser("description", analyzer);
217         // 建立查詢對象(這裏是使用了查詢語法指定了description域若是不指定按照上面默認的field域)
218         Query query = queryParser.parse("description:java");
219         // 建立索引目錄的流對象,指定索引目錄位置
220         Directory d = FSDirectory.open(new File("C:\\Users\\dangxiaopeng\\Desktop\\LuceneIndexData"));
221         // 索引讀取對象
222         // 指定讀取索引的目錄
223         IndexReader indexReader = IndexReader.open(d);
224         // 索引搜索對象
225         IndexSearcher indexSearcher = new IndexSearcher(indexReader);
226         // 執行搜索
227         // 參數:query查詢對象、取出匹配度高的前n條記錄
228         TopDocs topDocs = indexSearcher.search(query, 100);
229         // 取出匹配上的文檔
230         ScoreDoc[] scoreDocs = topDocs.scoreDocs;
231         for (ScoreDoc scoreDoc : scoreDocs) {
232             // document的id
233             int docId = scoreDoc.doc;
234             // 從indexReader根據docId獲取document
235             Document doc = indexReader.document(docId);
236             // 取出doc中field域的內容
237             // 參數指定field域名
238             String id = doc.get("id");
239             String name = doc.get("name");
240             Float price = Float.parseFloat(doc.get("price"));
241             String pic = doc.get("pic");
242 
243             System.out.println(id + "-" + name + "-" + price + "-" + pic);
244         }
245         // 關閉資源
246         indexReader.close();
247     }
248 }

Lucene深刻(Luke&&中文分詞器&&查詢語句見相關文檔)mysql

相關文章
相關標籤/搜索