11.26學習筆記(hadoop)

TEZ:將MR作業進行分析優化,構建成一個有向無環圖 Spark和MR邏輯一樣,但是Spark基於內存,MR基於磁盤,故Spark性能比MR高 HIVE:實現數據倉庫功能對歷史數據進行分析,把SQL語句轉化成MR作業執行(批量數據處理) PIG:流數據處理,輕量級數據分析 Oozie:工作流管理工具 Zookeeper:分佈式協調一致性服務 HDFS:分佈式文件系統 HBase:非關係型的分佈式數
相關文章
相關標籤/搜索