solr Query[轉]

時間 2019-12-07

標籤 solr query 简体版

原文原文鏈接

一. Query參數
1. CoreQueryParam查詢的參數
1) q: 查詢字符串，必須的。
2) q.op: 覆蓋schema.xml的defaultOperator（有空格時用"AND"仍是用"OR"操做邏輯），通常默認指定。
3) df: 默認的查詢字段，通常默認指定。
4) qt: query type，指定查詢使用的Query Handler，默認爲「standard」。
5) wt: writer type。指定查詢輸出結構格式，默認爲「xml」。在solrconfig.xml中定義了查詢輸出格式：xml、json、python、ruby、php、phps、custom。
6) echoHandler：是否在查詢結果中顯示使用的Query Handler名稱。
7) echoParams：是否顯示查詢參數。none：不顯示；explicit：只顯示查詢參數；all：全部，包括在solrconfig.xml定義的Query Handler參數。
8) indent - 返回的結果是否縮進，默認關閉，用 indent=true|on 開啓，通常調試json,php,phps,ruby輸出纔有必要用這個參數。
9) version - 查詢語法的版本，建議不使用它，由服務器指定默認值。

2. CommonQueryParameters
1) sort：排序，格式：sort=<field name>+<desc|asc>[,<field name>+<desc|asc>]„ 。
示例：（inStock desc, price asc）表示先「inStock」降序, 再「price」升序，默認是相關性降序。。
2) start：用於分頁定義結果起始記錄數，默認爲0。
3) rows：用於分頁定義結果每頁返回記錄數，默認爲10。
4) fq：filter query。使用Filter Query能夠充分利用Filter Query Cache，提升檢索性能。做用：在q查詢符合結果中同時是fq查詢符合的，
例如：q=mm&fq=date_time:[20081001 TO 20091031]，找關鍵字mm，而且date_time是20081001到20091031之間的。
5) fl：field list。指定返回結果字段。以空格「」或逗號「,」分隔。
6) debugQuery：設置返回結果是否顯示Debug信息。
7) explainOther：設置當debugQuery=true時，顯示其餘的查詢說明。
8) defType：設置查詢解析器名稱。
9) timeAllowed：設置查詢超時時間。
10) omitHeader：設置是否忽略查詢結果返回頭信息，默認爲「false」。

二. 查詢語法
1. 匹配全部文檔：*:* php

2. 強制、阻止和可選查詢：
1) Mandatory：查詢結果中必須包括的(for example, only entry name containing the word make) Solr/Lucene Statement：+make, +make +up ,+make +up +kiss
2) prohibited：(for example, all documents except those with word believe) Solr/Lucene Statement：+make +up -kiss 3) optional：Solr/Lucene Statement：+make +up kiss

3. 布爾操做：AND、OR和NOT布爾操做（必須大寫）與Mandatory、optional和prohibited類似。
1) make AND up ＝ +make +up :AND左右兩邊的操做都是mandatory
2) make || up ＝ make OR up＝make up :OR左右兩邊的操做都是optional
3) +make +up NOT kiss ＝ +make +up –kiss
4) make AND up OR french AND Kiss不能夠達到指望的結果，由於AND兩邊的操做都是mandatory的。 python

4. 子表達式查詢（子查詢）：可使用「()」構造子查詢。
For ex：(make AND up) OR (french AND Kiss)

5. 子表達式查詢中阻止查詢的限制：
For ex:make (-up):只能取得make的查詢結果；要使用make (-up *:*)查詢make或者不包括up的結果。算法

6. 多字段fields查詢：經過字段名加上分號的方式（fieldName:query）來進行查詢
For ex：entryNm:make AND entryId:3cdc86e8e0fb4da8ab17caed42f6760c json

7. 通配符查詢（wildCard Query）：
1) 通配符？和*：「*」表示匹配任意字符；「？」表示匹配出現的位置。
For ex：ma?*（ma後面的一個位置匹配），ma??*(ma後面兩個位置都匹配)
2) 查詢字符必需要小寫：+Ma +be**能夠搜索到結果；+Ma +Be**沒有搜索結果
3) 查詢速度較慢，尤爲是通配符在首位：主要緣由一是須要迭代查詢字段中的每一個term，判斷是否匹配；二是匹配上的term被加到內部的查詢，當terms數量達到1024的時候，查詢會失敗。
4) Solr中默認通配符不能出如今首位（能夠修改QueryParser，設置 setAllowLeadingWildcard爲true）
5) set setAllowLeadingWildcard to true. ruby

8. 模糊查詢、類似查詢：不是精確的查詢，經過對查詢的字段進行從新插入、刪除和轉換來取得得分較高的查詢解決（由Levenstein Distance Algorithm算法支持）。
1) 通常模糊查詢：for ex：make-believ~
2) 門檻模糊查詢：對模糊查詢能夠設置查詢門檻，門檻是0~1之間的數值，門檻
越高表面類似度越高。For ex：make-believ~0.五、make-believ~0.八、make-believ~0.9 服務器

9. 範圍查詢（Range Query）：Lucene支持對數字、日期甚至文本的範圍查詢。結束的範圍可使用「*」通配符。
For ex：
1) 日期範圍（ISO-8601 時間GMT）：sa_type:2 AND a_begin_date:[1990-01-01T00:00:00.000Z TO 1999-12-31T24:59:99.999Z]
2) 數字：salary:[2000 TO *] 3) 文本：entryNm:[a TO a]

10. 日期匹配：YEAR, MONTH, DAY, DATE (synonymous with DAY) HOUR, MINUTE, SECOND, MILLISECOND, and MILLI (synonymous with MILLISECOND)能夠被標誌成日期。
For ex：
1) r_event_date:[* TO NOW-2YEAR]：2年前的如今這個時間
2) r_event_date:[* TO NOW/DAY-2YEAR]：2年前前一天的這個時間

三. 函數查詢（Function Query）
函數查詢能夠利用 numeric域的值或者與域相關的的某個特定的值的函數，來對文檔進行評分。
1. 使用函數查詢的方法
這裏主要有三種方法可使用函數查詢，這三種s方法都是經過solr http接口的。
1) 使用FunctionQParserPlugin。ie: q={!func}log(foo)
2) 使用「_val_」內嵌方法內嵌在正常的solr查詢表達式中。即，將函數查詢寫在 q這個參數中，這時候，咱們使用「_val_」將函數與其餘的查詢加以區別。 ie：entryNm:make && _val_:ord(entryNm)
3) 使用dismax中的bf參數使用明確爲函數查詢的參數，好比說dismax中的bf（boost function）這個參數。  注意：bf這個參數是能夠接受多個函數查詢的，它們之間用空格隔開，它們還能夠帶上權重。因此，當咱們使用bf這個參數的時候，咱們必須保證單個函數中是沒有空格出現的，否則程序有可能會覺得是兩個函數。
For ex：
q=dismax&bf="ord(popularity)^0.5 recip(rord(price),1,1000,1000)^0.3   2. 函數的格式（Function Query Syntax) 目前，function query 並不支持 a+b 這樣的形式，咱們得把它寫成一個方法形式，這就是 sum(a,b).

3. 使用函數查詢注意事項
1) 用於函數查詢的field必須是被索引的；
2) 字段不能夠是多值的（multi-value）

4.  能夠利用的函數（available function）
1) constant：支持有小數點的常量；例如：1.5 ；SolrQuerySyntax:_val_:1.5
2) fieldvalue：這個函數將會返回numeric field的值，這個域必須是indexd的，非multiValued的。格式很簡單，就是該域的名字。若是這個域中沒有這樣的值，那麼將會返回0。
3) ord：對於一個域，它全部的值都將會按照字典順序排列，這個函數返回你要查詢的那個特定的值在這個順序中的排名。這個域，必須是非multiValued的，當沒有值存在的時候，將返回0。例如：某個特定的域只能去三個值，「apple」、「banana」、「pear」，那麼ord（「apple」）=1，ord（「banana」）=2，ord（「pear」）=3.須要注意的是，ord（）這個函數，依賴於值在索引中的位置，因此當有文檔被刪除、或者添加的時候，ord（）的值就會發生變化。當你使用MultiSearcher的時候，這個值也就是不定的了。
4) rord：這個函數將會返回與ord相對應的倒排序的排名。格式: rord(myIndexedField)。
5) sum：這個函數的意思就顯而易見啦，它就是表示「和」啦。格式：sum(x,1) 、sum(x,y)、 sum(sqrt(x),log(y),z,0.5)
6) product：product(x,y,...)將會返回多個函數的乘積。格式：product(x,2)、product(x,y)
7) div：div(x,y)表示x除以y的值，格式：div（1,x）、div(sum(x,100),max(y,1))
8) pow：pow表示冪值。pow(x,y) =x^y。例如：pow(x,0.5) 表示開方pow(x,log(y))
9) abs：abs(x)將返回表達式的絕對值。格式：abs(-5)、 abs(x)
10)  log：log(x)將會返回基數爲10，x的對數。格式： log(x)、 log(sum(x,100))
11)  Sqrt：sqrt(x) 返回一個數的平方根。格式：sqrt（2）、sqrt(sum(x,100))
12)  Map：若是 x>=min,且x<=max,那麼map(x,min,max,target)=target.若是 x不在[min,max]這個區間內，那麼map(x,min,max,target)=x.  格式：map(x,0,0,1)
13) Scale：scale(x,minTarget,maxTarget) 這個函數將會把x的值限制在[minTarget,maxTarget]範圍內。 14) query ：query(subquery,default)將會返回給定subquery的分數，若是subquery與文檔不匹配，那麼將會返回默認值。任何的查詢類型都是受支持的。能夠經過引用的方式，也能夠直接指定查詢串。
例子：q=product(popularity, query({!dismax v='solr rocks'}) 將會返回popularity和經過dismax 查詢獲得的分數的乘積。
q=product(popularity, query($qq)&qq={!dismax}solr rocks 跟上一個例子的效果是同樣的。不過這裏使用的是引用的方式
q=product(popularity, query($qq,0.1)&qq={!dismax}solr rocks 在前一個例子的基礎上又加了一個默認值。
15)  linear： inear(x,m,c)表示 m*x+c ,其中m和c都是常量，x是一個變量也能夠是一個函數。例如： linear(x,2,4)=2*x+4.
16) Recip：recip(x,m,a,b)=a/(m*x+b)其中，m、a、b是常量，x是變量或者一個函數。當a=b，而且x>=0的時候，這個函數的最大值是1，值的大小隨着x的增大而減少。例如：recip(rord(creationDate),1,1000,1000)
17) Max： max(x,c)將會返回一個函數和一個常量之間的最大值。例如：max(myfield,0)app

1. solr-query
2. Solr -- query和filter query
3. solr多組Merge Query原理
4. solr的Query Syntax and Parsing分析（一）
5. [轉]solr入門
6. solr
7. @Query Annotation in Spring Data JPA--轉
8. Solr
9. Solr--Solr管理界面
10. Solr全部的查詢解析器Query Parsers
更多相關文章...
• PDO::query - PHP參考手冊
• XSLT - 轉換 - XSLT 教程
• 使用阿里雲OSS+CDN部署前端頁面與加速靜態資源
• JDK13 GA發佈：5大特性解讀

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。