大數據教程（11.5）倉庫工具hive的實現機制

時間 2019-11-06

標籤數據教程 11.5 倉庫工具 hive 實現機制欄目 Hadoop 简体版

原文原文鏈接

上一篇文章介紹了hadoop聯邦集羣的搭建過程。至此，hadoop的整個知識系統就差很少結束了。本篇博客開始，博主將分享數據倉庫hive工具的原理以及使用。數據庫

1、Hive基本概念服務器

(1)什麼是Hive函數

Hive是基於Hadoop的一個數據倉庫工具，能夠將結構化的數據文件映射爲一張數據庫表，並提供類SQL查詢功能。工具

(2)爲何使用Hiveoop

直接使用hadoop所面臨的問題：a.人員學習成本過高 b.項目週期要求過短 c.MapReduce實現複雜查詢邏輯開發難度太大【這一點相信你們在以前的博客中作hadoop的join操做時就已經能體會到了】
使用Hive的好處：操做接口採用類SQL語法，提供快速開發的能力。避免了去寫MapReduce，減小開發人員的學習成本。擴展功能很方便。學習

(3)Hive的特色大數據

可擴展：Hive能夠自由的擴展集羣的規模，通常狀況下不須要重啓服務。blog

延展性：Hive支持用戶自定義函數，用戶能夠根據本身的需求來實現本身的函數。接口

容錯：良好的容錯性，節點出現問題SQL仍可完成執行。hadoop

2、Hive的使用場景