1、什麼是Hivemysql
Hive是創建在 Hadoop 上的數據倉庫基礎構架。它提供了一系列的工具,能夠用來進行數據提取轉化加載(ETL),這是一種能夠存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。Hive 定義了簡單的類 SQL 查詢語言,稱爲 HQL,它容許熟悉 SQL 的用戶查詢數據。同時,這個語言也容許熟悉 MapReduce 開發者的開發自定義的 mapper 和 reducer 來處理內建的 mapper 和 reducer 沒法完成的複雜的分析工做。sql
Hive 沒有專門的數據格式。 Hive 能夠很好的工做在 Thrift 之上,控制分隔符,也容許用戶指定數據格式。數據庫
2、Hive的應用場景apache
.編譯器將一個Hive QL轉換操做符
.操做符是Hive的最小的處理單元
.每一個操做符表明HDFS的一個操做或者一道MapReduce做業瀏覽器
操做符
|
描述
|
TableScanOperator
|
掃描hive表數據
|
ReduceSinkOperator
|
建立將發送到Reducer端的<Key,Value>對
|
JoinOperator
|
Join兩份數據
|
SelectOperator
|
選擇輸出列
|
FileSinkOperator
|
創建結果數據,輸出至文件
|
FilterOperator
|
過濾輸入數據
|
GroupByOperator
|
GroupBy語句
|
MapJoinOperator
|
/*+mapjoin(t) */
|
LimitOperator
|
Limit語句
|
UnionOperator
|
Union語句
|