solr搜索智能提示Suggest

時間 2019-12-06

標籤 solr 搜索智能提示 suggest 简体版

原文原文鏈接

solr1.4之後實現的智能提示，方便用戶輸入搜索 java

Suggest配置 apache

<searchComponent name="suggest" class="solr.SpellCheckComponent">
	<str name="queryAnalyzerFieldType">string</str>
	<lst name="spellchecker">  
		<str name="name">suggest</str>  
		<str name="classname">org.apache.solr.spelling.suggest.Suggester</str>  
		<str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>  
		<str name="field">name</str>
		<float name="threshold">0.0001</float>
		<!--<str name="sourceLocation">suggest_dict.txt</str>-->
		<!--<str name="spellcheckIndexDir">spellchecker</str>-->
        <str name="comparatorClass">freq</str>
        <str name="buildOnOptimize">true</str>
		<str name="buildOnCommit">true</str>     
	</lst>  
  </searchComponent>    
 
  <requestHandler name="/suggest" class="org.apache.solr.handler.component.SearchHandler">  
	<lst name="defaults">  
		<str name="spellcheck">true</str>  
		<str name="spellcheck.dictionary">suggest</str>  
		<str name="spellcheck.count">8</str>  
		<str name="spellcheck.onlyMorePopular">true</str>
		<str name="spellcheck.extendedResults">false</str>		
		<str name="spellcheck.collate">true</str>
		<!--<str name="spellcheck.build">true</str>	-->	
	</lst>  
	<arr name="components">  
		<str>suggest</str>  
	</arr>  
  </requestHandler>

說明： ide

1.solr的suggest基於solr.SpellCheckComponent ui

2.queryAnalyzerFieldType 參數爲string，在這不要定義複雜分詞，若是是根據某一個索引字段，意義不大 spa

3.field字段名，表示基於schema中的某一個索引字段 code

4.threshold限制一些不經常使用的詞出現，值越大過濾紙越多 component

5.sourceLocation用於設置字典，若是有一個字典能記錄用戶常搜索的字，那提示更更好 server

6.spellcheckIndexDir若是已經設置spellcheck，那麼能夠在此制定目錄 xml

7.字典格式以下排序

# This is a sample dictionary file.

acquire

accidentally\t2.0

accommodate\t3.0

文本格式utf-8，#開頭表示註釋，被忽略

每個詞一行，後面帶權重

8.配置詞典後在requestHandler中設置spellcheck.onlyMorePopular爲true，能夠根據權重排序

9.spellcheck.count返回行

配置完成重啓服務後，設置參數suggest/?spellcheck.build=true來建立spellchecker的索引

而後輸入：http://ip:port/corename/suggest?q=xxx進行搜索了

接下來就是前臺js實現的問題了。

固然也能夠經過solrj來進行搜索

CommonsHttpSolrServer server = new CommonsHttpSolrServer(
				"http://ip:port/corename/");
	SolrQuery params = new SolrQuery();
		String token = "牛";
		params.set("qt", "/suggest");
		params.set("q", token);
		params.set("spellcheck.build", "true");
		QueryResponse response = null;

		try {
			response = server.query(params);
			System.out.println("查詢耗時：" + response.getQTime());
		} catch (SolrServerException e) {
			System.err.println(e.getMessage());
			e.printStackTrace();
		} catch (Exception e) {
			System.err.println(e.getMessage());
			e.printStackTrace();
		} finally {
		}

		SpellCheckResponse spellCheckResponse = response
				.getSpellCheckResponse();
		if (spellCheckResponse != null) {
			List<Suggestion> suggestionList = spellCheckResponse
					.getSuggestions();
			for (Suggestion suggestion : suggestionList) {
				System.out.println("Suggestions NumFound: "
						+ suggestion.getNumFound());
				System.out.println("Token: " + suggestion.getToken());
				System.out.print("Suggested: ");
				List<String> suggestedWordList = suggestion.getAlternatives();
				for (String word : suggestedWordList) {
					System.out.println(word + ", ");
				}
				System.out.println();
			}
		}

這樣就能夠。

對於Suggest，我的的想法，字典是一種好的方式，可是增長字典比較麻煩，還有能夠獨立一個字段，對該字段作一些特殊的分詞，好比像商品搜索類，整個標題能夠是一個詞，中文，數字，英文，符號等間隔的分開，這個具體仍是看應用了。

如今我在誠交網易貨商品搜索上用的是字段的方式，新建一個單獨的排序字段，而後把須要提示的字段拷貝過來，效果還算能夠，你們能夠上誠交網產品搜索體驗一下。

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。