轉自:http://blog.csdn.net/congcong68/article/details/51419231 javascript
聚合指各類能夠處理批量記錄並返回計算結果的操做,並MongoDB提供了豐富的聚合操做,MongoDB提供了進行聚合的三種方式:彙集管道(Aggregation),Map-Reduce方法,和單一用途的聚合方法。java
單一用途的聚合方法:db.collection.count(), db.collection.group(), db.collection.distinct()。mysql
一:db.collection.count() 返回匹配查詢結果的數量
db.collection.count(query, options) 返回匹配查詢結果的數量 至關於mysql的語法:select count(1) from orders where 條件。sql
- > db.orders.find()
- { "_id" : ObjectId("57383f492bd2092c7ed0fec7"), "ino" : "001", "quantity" : 2, "
- price" : 4 }
- { "_id" : ObjectId("57383f492bd2092c7ed0fec8"), "ino" : "002", "quantity" : 2, "
- price" : 6 }
- { "_id" : ObjectId("57383f492bd2092c7ed0fec9"), "ino" : "003", "quantity" : 3, "
- price" : 5 }
- > db.orders.count()
- 3
-
- > db.orders.count({quantity:{$gt:2}})
- 1
也能夠這樣獲取返回匹配查詢結果的數量:數據庫
var cursor=db.items.find() 能夠以查詢只包含索引鍵的條件, cursor.count()。數組
二: db.collection.distinct() 返回某個字段的非重複值列表
db.collection.distinct(field, query) 返回指定某個字段的非重複的值的列表,結果不能大於最大BSON大小(大小爲4 MB) 至關於mysql的語法:select distinct(field) from orders where 條件。
- > db.orders.find()
- { "_id" : ObjectId("57383f492bd2092c7ed0fec7"), "ino" : "001", "quantity" : 2, "
- price" : 4 }
- { "_id" : ObjectId("57383f492bd2092c7ed0fec8"), "ino" : "002", "quantity" : 2, "
- price" : 6 }
- { "_id" : ObjectId("57383f492bd2092c7ed0fec9"), "ino" : "003", "quantity" : 3, "
- price" : 5 }
- > db.orders.distinct("quantity")
- [ 2, 3 ]
三: db.collection.group()
db.collection.group({ key, reduce, initial[, keyf] [, cond] [, finalize] })
咱們比較熟悉的group by 的sql語句select key from table group by key,而mongoDB沒提供SQL那樣經過group By就輕鬆實現數據庫的分組功能, db.collection.group()是對某個字段的對集合進行分組,而後經過聚合每一組中的全部文檔,能夠對聚合每一組中的全部文檔進行處理,來產生最終的咱們想要的結果文檔。
db.collection.group()使用JavaScript,它受到了一些性能上的限制。大多數狀況下,$ group在Aggregation Pipeline提供了一種具備較少的限制適用的替代。能夠經過指定的鍵的集合中的文檔和執行簡單的聚合函數。
(1)在2.2版本中,返回的數組能夠包含最多20000個元素;即最多20000個獨特的分組。
(2)彙集管道(Aggregation),Map-Reduce方法均可以運行在分片集合,group()方法不能運行在分片集羣中工做。
(3)結果集必須符合最大BSON文檔大小(大小爲4 MB)。
1. 訂單集合記錄日期和明細中的數量、產品編碼,咱們訂單集合按照對日期和產品編碼進行分組字段,而後對每一組文檔進行處理,找出並計算相同的產品的數量。Sql語句:Select pnumber,sum(quantity) as total from orders,items group by pnumber(少了兩張表的關聯的條件)。
- > db.orders.find()
- { "_id" : ObjectId("573848342bd2092c7ed0feca"), "onumber" : "001", "date" : ISOD
- ate("2014-01-02T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 2, "price"
- : 5, "pnumber" : "p003" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fecb"), "onumber" : "002", "date" : ISOD
- ate("2014-01-03T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 1, "price"
- : 4, "pnumber" : "p002" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fecc"), "onumber" : "003", "date" : ISOD
- ate("2014-01-04T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 10, "price
- " : 2, "pnumber" : "p001" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fecd"), "onumber" : "003", "date" : ISOD
- ate("2014-01-04T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 30, "price
- " : 4, "pnumber" : "p002" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fece"), "onumber" : "004", "date" : ISOD
- ate("2014-01-05T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 5, "price"
- : 4, "pnumber" : "p002" } }
-
- > db.orders.group({
- ... key: {'item.pnumber':1},
- ... initial : {"total":0},
- ... reduce : function Reduce(doc, out) {
- ... out.total+=doc.item.quantity
- ... } });
- [
- {
- "item.pnumber" : "p003",
- "total" : 2
- },
- {
- "item.pnumber" : "p002",
- "total" : 36
- },
- {
- "item.pnumber" : "p001",
- "total" : 10
- }
- ]
描述:
key:做爲分組的key。
reduce:一個聚合函數操做文檔的分組操做期間。這些函數能夠返回一個sum或count。該函數接受兩個參數:當前 文檔和這個羣體彙集的結果文檔。
initial:初始化聚合結果文檔變量,爲空時自動爲每列提供初始變量。
keyf:可選。替代的key 字段。指定一個函數建立一個「key object」做爲分組的key。使用keyf而是經過group by領域而不是現有的文檔域鍵組。
cond:過濾條件,根據條件過濾集合的文檔。
二、完成器【finalize】
咱們對finalize方法 進行詳細的介紹,在db.collection.group()返回最終結果以前,每一組文檔執行完後,多會觸發此方法,此功能能夠修改的結果文檔或替換的結果文檔做爲一個總體,執行group()結果集必須符合最大BSON文檔大小(大小爲4 MB),finalize能對數據傳到客戶時,進行裁剪結果,能夠提升很大的效率。
(1) 咱們對訂單集合根據日期進行分組,並對相同的產品號數量進行累加,對累加完的產品數量沒有大於20 的咱們進行刪除。減小返回的數據。
- db.orders.group({
- key: {date:1},
- initial : {"pnumbers":{}},
- reduce : function Reduce(doc, out) {
- if(out.pnumbers[doc.item.pnumber]==null){
- out.pnumbers[doc.item.pnumber]=new Object();
- out.pnumbers[doc.item.pnumber]=doc.item.quantity;
- }else{
- out.pnumbers[doc.item.pnumber]+=doc.item.quantity;
- }
- },finalize : function Finalize(doc) {
- for(i in doc.pnumbers)
- {
- if (doc.pnumbers[i] < 20)
- {
- delete doc.pnumbers[i];
- }
- }
- } });
-
- [
- {
- "date" : ISODate("2014-01-02T16:03:00Z"),
- "pnumbers" : {
-
- }
- },
- {
- "date" : ISODate("2014-01-03T16:03:00Z"),
- "pnumbers" : {
-
- }
- },
- {
- "date" : ISODate("2014-01-04T16:03:00Z"),
- "pnumbers" : {
- "p002" : 30
- }
- },
- {
- "date" : ISODate("2014-01-05T16:03:00Z"),
- "pnumbers" : {
-
- }
- }
(2)每一組文檔執行完後,多會觸發此方法,此功能能夠修改的結果文檔,咱們對訂單的集合實現一天賣出了多少個產品,金額是多少,平均價格是多少。
- db.orders.group({
- key: {date:1},
- initial :{"total":0,"money":0},
- reduce : function Reduce(doc, out) {
- out.total+=doc.item.quantity;
- out.money+=doc.item.quantity*doc.item.price;
- },
- finalize : function Finalize(out) {
- out.avg=out.money/out.total
- return out;
- }
- });
- [
- {
- "date" : ISODate("2014-01-02T16:03:00Z"),
- "total" : 2,
- "money" : 10,
- "avg" : 5
- },
- {
- "date" : ISODate("2014-01-03T16:03:00Z"),
- "total" : 1,
- "money" : 4,
- "avg" : 4
- },
- {
- "date" : ISODate("2014-01-04T16:03:00Z"),
- "total" : 40,
- "money" : 140,
- "avg" : 3.5
- },
- {
- "date" : ISODate("2014-01-05T16:03:00Z"),
- "total" : 5,
- "money" : 20,
- "avg" : 4
- }
3.keyf的使用
能夠接受一個javascript函數,用來動態的肯定分組文檔的字段,和key二者必須有一個。咱們有時用到比較複雜的key時,能夠經過keyf的方法使用javascript函數對要進行分組的字段先進行特殊的處理,而後在作爲key進行分組。
咱們對訂單集合,按照日期的月份進行分組,咱們保存的文檔的日期是到天,因此咱們先轉換爲月,並計算月份賣出了多少個產品,金額是多少,平均價格是多少。
-
- > db.orders.find({})
- { "_id" : ObjectId("573848342bd2092c7ed0feca"), "onumber" : "001", "date" : ISOD
- ate("2014-01-02T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 2, "price"
- : 5, "pnumber" : "p003" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fecb"), "onumber" : "002", "date" : ISOD
- ate("2014-01-03T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 1, "price"
- : 4, "pnumber" : "p002" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fecc"), "onumber" : "003", "date" : ISOD
- ate("2014-01-04T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 10, "price
- " : 2, "pnumber" : "p001" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fecd"), "onumber" : "003", "date" : ISOD
- ate("2014-01-04T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 30, "price
- " : 4, "pnumber" : "p002" } }
- { "_id" : ObjectId("573848342bd2092c7ed0fece"), "onumber" : "004", "date" : ISOD
- ate("2014-01-05T16:03:00Z"), "cname" : "zcy", "item" : { "quantity" : 5, "price"
- : 4, "pnumber" : "p002" } }
- > db.orders.group({
- ... keyf: function (doc){
- ... return{'month':doc.date.getMonth()+1};
- ... },
- ... initial :{"total":0,"money":0},
- ... reduce : function Reduce(doc, out) {
- ... out.total+=doc.item.quantity;
- ... out.money+=doc.item.quantity*doc.item.price;
- ...
- ... },
- ... finalize : function Finalize(out) {
- ... out.avg=out.money/out.total
- ... return out;
- ... }
- ... });
- [ { "month" : 1, "total" : 48, "money" : 174, "avg" : 3.625 } ]
MongoDB提供了進行聚合的三種方式:彙集管道(Aggregation),Map-Reduce方法,和單一用途的聚合方法,先介紹了單一用途的聚合方法的使用方法,接下去介紹彙集管道(Aggregation)和Map-Reduce方法。