上一篇文章介紹了hadoop聯邦集羣的搭建過程。至此,hadoop的整個知識系統就差很少結束了。本篇博客開始,博主將分享數據倉庫hive工具的原理以及使用。數據庫
1、Hive基本概念服務器
(1)什麼是Hive函數
Hive是基於Hadoop的一個數據倉庫工具,能夠將結構化的數據文件映射爲一張數據庫表,並提供類SQL查詢功能。工具
(2)爲何使用Hiveoop
直接使用hadoop所面臨的問題 :a.人員學習成本過高 b.項目週期要求過短 c.MapReduce實現複雜查詢邏輯開發難度太大【這一點相信你們在以前的博客中作hadoop的join操做時就已經能體會到了】
使用Hive的好處:操做接口採用類SQL語法,提供快速開發的能力。 避免了去寫MapReduce,減小開發人員的學習成本。 擴展功能很方便。學習
(3)Hive的特色大數據
可擴展:Hive能夠自由的擴展集羣的規模,通常狀況下不須要重啓服務。blog
延展性:Hive支持用戶自定義函數,用戶能夠根據本身的需求來實現本身的函數。接口
容錯:良好的容錯性,節點出現問題SQL仍可完成執行。hadoop
2、Hive的使用場景
3、Hive的使用原理
最後寄語,以上是博主本次文章的所有內容,若是你們以爲博主的文章還不錯,請點贊;若是您對博主其它服務器大數據技術或者博主本人感興趣,請關注博主博客,而且歡迎隨時跟博主溝通交流。