solr StatsComponent(聚合統計)

1、概述數據庫

 Solr能夠利用StatsComponent 實現數據庫的聚合統計查詢,也就是min、max、avg、count、sum的功能。apache

2、參數ruby

參數    含義 bash

stats    是否開啓stats(true/false) spa

stats.field 添加一個字段來統計,能夠有多個 code

stats.facet 在給定的面返回值的子結果。 orm

3、參考實例xml

 參考實例一:字符串

查詢參數 it

q=*:*&stats=true&stats.field=price
&stats.field=popularity
&rows=0

返回結果以下:

<lst name="stats">
 <lst name="stats_fields">
  <lst name="price">
    <double name="min">0.0</double>        --最小值    
    <double name="max">2199.0</double>     --最大值    
    <double name="sum">5251.2699999999995</double> --總和    
    <long name="count">15</long>                   --記錄數,也就是多少行記錄    
    
    <long name="missing">11</long>                 --結果集中,有多少條記錄是空值  
      <double name="sumOfSquares">6038619.160300001</double> --平方和(x1^2 + x2^2+xn^2)   
       <double name="mean">350.08466666666664</double>        --平均數(x1+x2+xn)/n    
       <double name="stddev">547.737557906113</double>        --標準差  </lst>
  <lst name="popularity">
    <double name="min">0.0</double>
    <double name="max">10.0</double>
    <double name="sum">90.0</double>
    <long name="count">26</long>
    <long name="missing">0</long>
    <double name="sumOfSquares">628.0</double>
    <double name="mean">3.4615384615384617</double>
    <double name="stddev">3.5578731762756157</double>
  </lst>
 </lst></lst>

參數含義以下: 

返回字段 字段含義 

min 最小值 

max 最大值 

sum 總和 

count 記錄數,也就是多少行記錄 

missing 結果集中,有多少條記錄是空值 

sumOfSquares 平方和(x1^2 + x2^2+xn^2) 

mean 平均數(x1+x2+xn)/n 

stddev 標準差 

參考實例二:

查詢參數以下

q=*:*
&stats=true&stats.field=price
&stats.field=popularity
&stats.facet=inStock
&rows=0

返回結果以下所示:

<lst name="stats">
 <lst name="stats_fields">
  <lst name="price">
  <double name="min">0.0</double>
  <double name="max">2199.0</double>
  <double name="sum">5251.2699999999995</double>
  <long name="count">15</long>
  <long name="missing">11</long>
  <double name="sumOfSquares">6038619.160300001</double>
  <double name="mean">350.08466666666664</double>
  <double name="stddev">547.737557906113</double>
  <lst name="facets">
   <lst name="inStock">
    <lst name="false">  --統計的是:在返回結果中inStock等於false部分,price的統計  
        <double name="min">11.5</double>   --在inStock等於false的記錄中pirce的最小值     
        <double name="max">649.99</double> --在inStock等於false的記錄中pirce的最大值      
        <double name="sum">1161.39</double>--在inStock等於false的記錄中pirce的總和     
        <long name="count">4</long>        --inStock等於false的記錄數    
        <long name="missing">0</long>      --在inStock等於false的記錄中pirce等於空的記錄     
        <double name="sumOfSquares">653369.2551</double>--在inStock等於false的記錄中pirce的平方和              <double name="mean">290.3475</double>--在inStock等於false的記錄中pirce的平均值     
       <double name="stddev">324.63444676281654</double>--在inStock等於false的記錄中pirce的標準差   
    </lst>
    <lst name="true">
      <double name="min">0.0</double>
      <double name="max">2199.0</double>
      <double name="sum">4089.879999999999</double>
      <long name="count">11</long>
      <long name="missing">0</long>
      <double name="sumOfSquares">5385249.905200001</double>
      <double name="mean">371.8072727272727</double>
      <double name="stddev">621.6592938755265</double>
    </lst>
   </lst>
  </lst>
 </lst></lst>

舒適提示:若是統計的列不是數字類型。而是字符串,那麼統計的結果中只有以下列

參考實例以下:查詢參數

q=*:*
&stats=true&stats.field=CAR_NUM&rows=0

返回結果以下所示:

<lst name="stats">
  <lst name="stats_fields">
    <lst name="CAR_NUM">
        <str name="min">08449</str>
        <str name="max">黑ZZ6T8警</str>
        <long name="count">9999999</long>
        <long name="missing">0</long>
        <lst name="facets"/>
    </lst>
   </lst></lst>

官方API地址:http://wiki.apache.org/solr/StatsComponent

相關文章
相關標籤/搜索