MongoDB的分組統計 group

時間 2019-11-19

原文原文鏈接

　　mongodb中的分組聚合用$group，並且處理的最大數據量爲100M若是超出須要寫入到磁盤，使用格式以下：java

{ $group: { _id: <expression>, <field1>: { <accumulator1> : <expression1> }, ... } }

　　其中_id屬性是必需要有的，目的是用來指定分組的字段或依據，field1爲自定義字段，accumulator爲累加器，下面以統計天天用戶註冊數爲列mongodb

db.user.aggregate([
    {
        $group:{
            _id:{
                year:{$year:{$add:["$time",28800000]}},//time爲註冊時間 $year表示獲取年份，用add是由於mongodb存的是UTC時間須要增長8個小時
                month:{$month:{$add:["$time",28800000]}},//$month獲取月份
                day:{$dayOfMonth:{$add:["$time",28800000]}}//$dayOfMonth獲取多少號
            }
            count:{$sum:1}//$sum爲累計，1表示累加數
        }
    }
])

　　若是隻想註冊地區爲四川的則在$goup前增長一個$match：express

{
    $match:{
         location:"SiChuan"
    }
},

　　以上兩個聚合操做的java實現方式：大數據

DBObject filterCond = new BasicDBObject();
filterCond.put("location", "SiChuan");
DBObject match = new BasicDBObject("$match", filterCond);

BasicDBList dateList = new BasicDBList();
dateList.add("$time");
dateList.add(28800000);//解決timezone 8小時時差
DBObject time = new BasicDBObject("$add", dateList);

DBObject group = new BasicDBObject(); 
DBObject groupDate = new BasicDBObject(); 
groupDate.put("year", new BasicDBObject("$year", time)); 
groupDate.put("month", new BasicDBObject("$month", time)); 
groupDate.put("day", new BasicDBObject("$dayOfMonth", time)); 
group.put("$group", new BasicDBObject("_id", groupDate));

AggregationOutput output = coll.aggregate(match, group); 
Iterator iterator = output.results().iterator();

　　更多的聚合操做請參見這》》》http://docs.mongodb.org/manual/reference/operator/aggregation-pipeline/spa

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。