從單詞統計看MapReduce算法內聚合

對MapReduce統計單詞出現次數在從單詞統計看MapReduce一文中已經做了簡單的介紹。對此給出了一個較爲簡單的統計算法: Map函數 輸入:(key:文檔a,value:文檔內容d) 輸出:(key:單詞t,value:單詞t在文檔d中出現的次數c) H<--new ASSOCIATIVEARRAY for all term t∈doc d do     H{t}=H{t}+1 for a
相關文章
相關標籤/搜索