Hadoop基本理論

1、什麼是Hadoop? Hadoop是一個分佈式系統。主要包含兩個核心組件HDFS和MR。 HDFS: 分佈式存儲系統,解決海量數據的存儲問題。 MR:分佈式計算框架,解決海量數據的處理問題。 在基礎的HDFS和MR基礎上,Hadoop生態圈又加入了其它的組件:     Habse 非關係型的分佈式數據庫,     Hive基於HDFS的數據倉庫,     Pig  一個基於MR的大數據分析平臺
相關文章
相關標籤/搜索