mapreduce概述 ------- 快速入門篇

MapReduce是什麼 mapreduce:分佈式並行離線計算框架,是一個分佈式運算程序的編程框架,是用戶開發「基於hadoop的數據分析應用」的核心框架;Mapreduce核心功能是將用戶編寫的業務邏輯代碼和自帶默認組件整合成一個完整的分佈式運算程序,併發運行在一個hadoop集羣上; 與HDFS解決問題的原理類似,HDFS是將大的文件切分成若干小文件,然後將它們分別存儲到集羣中各個主機中。
相關文章
相關標籤/搜索