hive最全學習線路和實踐練習

非原創,源自:https://www.cnblogs.com/snowbook/p/5723767.htmlhtml

hive被大多數企業使用,學習它,利於本身掌握企業所使用的技術,這裏從安裝使用到概念、原理及如何使用遇到的問題,來說解hive,但願對你們有所幫助。
此篇內容較多:
看完以後須要達到的目標
1.hive是什麼
2.明白hive的原理
3.會使用hive
4.會使用hive編程

1.hive
首先咱們須要hive是什麼?
讓你真正明白什麼是hive
上面講的很明白
1.hive是一個數據倉庫
2.hive基於hadoop。
總結爲一句話:hive是基於hadoop的數據倉庫。
hive明白以後,如同咱們明白了關係數據庫是什麼了,那麼咱們該如何使用操做它:
首先咱們要安裝,安裝分爲不少種分爲單機遇集羣安裝。
可參考下面內容:(正在更新)
Hive安裝指導
HIVE徹底分佈式集羣安裝過程(元數據庫: MySQL)
上面須要說明的是hive默認元數據庫並非mysql,可是由於默認元數據庫存在侷限,因此最好使用mysql。下面咱們附一張圖,先從總體瞭解。
<ignore_js_op>
安裝完畢,那麼咱們就須要練練手了,能夠根據下面內容
hive基本操做
會了基本的操做還不夠,如同咱們須要瞭解sql語法同樣,咱們須要瞭解hive各類語法
Hadoop Hive sql語法詳解1-認識hive及DDL操做
Hadoop Hive sql語法詳解2-修改表結構
Hadoop Hive sql語法詳解3--DML 操做:元數據存儲
Hadoop Hive sql語法詳解4--DQL 操做:數據查詢SQL
Hadoop Hive sql語法詳解5--HiveQL與SQL區別
這裏麪包含了加載數據、查詢數據等各類操做。
上面是一些基本的操做,下面還有一些負責一些操做如:
Hive快捷查詢:不啓用Mapreduce job啓用Fetch task三種方式介紹
Hive如何執行文件中的sql語句
Hive四種數據導入方式介紹
Hive中的三種不一樣的數據導出方式介紹
Hive如何建立索引
上面基本屬於實戰類型,咱們還須要高級進階,咱們須要瞭解裏面的原理,咱們須要知道遇到問題,該如何解決。
原理:
全面瞭解hive
Hive體系結構介紹
hive實現原理
hive內部表與外部表區別詳細介紹
HIVE中Join的專題---Join詳解
讓你完全明白hive數據存儲各類模式
Hive配置文件中配置項的含義詳解(收藏版)
HIVE與傳統數據庫對比
hive詳解
hive 配置參數說明(收藏版)
hive支持sql大全(收藏版)
hive 建立/刪除/截斷 表
原理大體懂了,基本操做會了,咱們可能又有了更進一步的認識,那麼hive如何結合hadoop,hbase發揮做用,該如何發揮它的實際意義,被咱們所用。
首先咱們使用hive的時候,不少都與hbase相結合,這樣發揮hive的長處,在各類查詢數據方面相比hbase使用更方便。
hive爲何與hbase整合
Hive與HBase整合完整指導
hadoop、hbase、hive版本對應關係
上面是與hbase結合使用,那麼咱們該如何與編程語言向結合,能夠參考下面內容:
經過JDBC驅動鏈接Hive操做實例
Hive:用Java代碼經過JDBC鏈接Hiveserver介紹
從 MapReduce 到 Hive 實戰分析
hive實戰
上面或許你已經對hive有所瞭解,下面的面試及遇到的問題,你們可參考
hive找不到建立的表了
Shark對Hive的支持與不支持的語法介紹
面試題:分別使用Hadoop MapReduce、hive統計手機流量
hive面試題目:表大概有2T左右,對錶數據轉換
hive如何經過設置日誌定位錯誤
hive在騰訊分佈式數據庫時間分享mysql

相關文章
相關標籤/搜索