MapReduce

一、例子 如果想統計下過去10年計算機論文出現最多的幾個單詞,看看大家都在研究些什麼,那收集好論文後,該怎麼辦呢? 方法一:我可以寫一個小程序,把所有論文按順序遍歷一遍,統計每一個遇到的單詞的出現次數,最後就可以知道哪幾個單詞最熱門了。 這種方法在數據集比較小時,是非常有效的,而且實現最簡單,用來解決這個問題很合適。 方法二:寫一個多線程程序,併發遍歷論文。 這個問題理論上是可以高度併發的,因爲統
相關文章
相關標籤/搜索