大數據入門(一)

大數據入門 hadoop HDFS YARN SPARK hadoop hadoop生態圈包括以下各個組成部分:  HDFS:用於分佈式文件存儲,切分成塊,多副本存於多臺機器。  YARN:用於資源管理和調度,job scheduling & cluster mangment  Zookeeper:各個框架的管理和協調  Hive:使系統支持SQL語句  ooize:工作流  pig:使用腳本sc
相關文章
相關標籤/搜索