關於MapReduce(一)

MapReduce是一種可用於數據處理的編程模型。該模型比較簡單,但是想寫出有用的程序卻不太容易。Hadoop可以運行Java、Ruby和Python等語言的MapReduce。最重要的是MapReduce本質上是並行運行的,因此可以將大規模的數據分析任務分發給任何一個擁有足夠多機器的數據中心。MapReduce的優勢在於處理大規模數據集,這裏先使用廣爲流傳的氣象數據集作爲例子來實現一個簡單的de
相關文章
相關標籤/搜索