8天學通MongoDB——第三天 細說高級操做

    今天跟你們分享一下mongodb中比較好玩的知識,主要包括:聚合,遊標。sql

一: 聚合mongodb

      常見的聚合操做跟sql server同樣,有:count,distinct,group,mapReduce。編程

<1> count數組

        count是最簡單,最容易,也是最經常使用的聚合工具,它的使用跟咱們C#裏面的count使用簡直如出一轍。分佈式

 

<2> distinct函數

       這個操做相信你們也是很是熟悉的,指定了誰,誰就不能重複,直接上圖。工具

 

<3> groupserver

    在mongodb裏面作group操做有點小複雜,不過你們對sql server裏面的group比較熟悉的話仍是一眼對象

能看的明白的,其實group操做本質上造成了一種「k-v」模型,就像C#中的Dictionary,好,有了這種思惟,排序

咱們來看看如何使用group。

    下面舉的例子就是按照age進行group操做,value爲對應age的姓名。下面對這些參數介紹一下:

       key:  這個就是分組的key,咱們這裏是對年齡分組。

       initial: 每組都分享一個」初始化函數「,特別注意:是每一組,好比這個的age=20的value的list分享一個

initial函數,age=22一樣也分享一個initial函數。

       $reduce: 這個函數的第一個參數是當前的文檔對象,第二個參數是上一次function操做的累計對象,第一次

爲initial中的{」perosn「:[]}。有多少個文檔, $reduce就會調用多少次。

   看到上面的結果,是否是有點感受,咱們經過age查看到了相應的name人員,不過有時咱們可能有以下的要求:

     ①:想過濾掉age>25一些人員。

     ②:有時person數組裏面的人員太多,我想加上一個count屬性標明一下。

 針對上面的需求,在group裏面仍是很好辦到的,由於group有這麼兩個可選參數: condition 和 finalize。

     condition:  這個就是過濾條件。

     finalize:這是個函數,每一組文檔執行完後,多會觸發此方法,那麼在每組集合裏面加上count也就是它的活了。

 

<4> mapReduce

        這玩意算是聚合函數中最複雜的了,不過複雜也好,越複雜就越靈活。

  mapReduce實際上是一種編程模型,用在分佈式計算中,其中有一個「map」函數,一個」reduce「函數。

   ① map:

          這個稱爲映射函數,裏面會調用emit(key,value),集合會按照你指定的key進行映射分組。

   ② reduce:

         這個稱爲簡化函數,會對map分組後的數據進行分組簡化,注意:在reduce(key,value)中的key就是

      emit中的key,vlaue爲emit分組後的emit(value)的集合,這裏也就是不少{"count":1}的數組。

   ③ mapReduce:

          這個就是最後執行的函數了,參數爲map,reduce和一些可選參數。具體看圖可知:

 

從圖中咱們能夠看到以下信息:

       result: "存放的集合名「;

       input:傳入文檔的個數。

       emit:此函數被調用的次數。

       reduce:此函數被調用的次數。

       output:最後返回文檔的個數。

最後咱們看一下「collecton」集合裏面按姓名分組的狀況。

 

二:遊標

    mongodb裏面的遊標有點相似咱們說的C#裏面延遲執行,好比:

      var list=db.person.find();

    針對這樣的操做,list其實並無獲取到person中的文檔,而是申明一個「查詢結構」,等咱們須要的時候經過

for或者next()一次性加載過來,而後讓遊標逐行讀取,當咱們枚舉完了以後,遊標銷燬,以後咱們在經過list獲取時,

發現沒有數據返回了。

 

固然咱們的「查詢構造」還能夠搞的複雜點,好比分頁,排序均可以加進去。

 var single=db.person.find().sort({"name",1}).skip(2).limit(2);

那麼這樣的「查詢構造」能夠在咱們須要執行的時候執行,大大提升了沒必要要的花銷。

相關文章
相關標籤/搜索