hive 數倉開發任務優化

Hive性能優化 項目:基於hive的dmp數據倉庫搭建 Hive:apache開源組件,基於hdfs文件系統及mapreduce計算引擎的關係型數據庫,弱索引(目前還沒怎麼有用過),基本不支持實施數據處理,適用於大數據量的存儲及離線的大數據量的數據挖掘 優化: 1:調度優化,模型優化 資源開放的情況下,模型日常T+1調度模型圖如下(數據流圖): 數據模型每層的調度要足夠靈活,儘量避免由於資源問題
相關文章
相關標籤/搜索