從單詞統計看MapReduce算法內聚合

時間 2021-01-18

原文原文鏈接

對MapReduce統計單詞出現次數在從單詞統計看MapReduce一文中已經做了簡單的介紹。對此給出了一個較爲簡單的統計算法: Map函數輸入:(key：文檔a，value：文檔內容d) 輸出:(key：單詞t，value：單詞t在文檔d中出現的次數c) H<--new ASSOCIATIVEARRAY for all term t∈doc d do H{t}=H{t}+1 for a

>>阅读原文<<