Hadoop生態系統

Hadoop生態系統 狹義的Hadoop Hadoop的三大核心組件 HDFS, MapReduce,YARN 廣義的Hadoop ​ HDFS:文件存儲系統基於硬盤 ​ YARN:資源調度框架 ​ MapReduce:分佈式處理框架 ​ Hive:數據倉庫 ​ RConnections:數據分析 ​ Mahout:機器學習庫 ​ pig:腳本語言,跟Hive類似 ​ Oozie:工作流引擎,管理
相關文章
相關標籤/搜索