Hive入門級教程(詳細)

什麼是Hive Hive 是建立在 Hadoop上的數據倉庫基礎構架。它提供了一系列的工具,可以用來進行數據提取轉化加載(ETL ),這是一種可以存儲、查詢和分析存儲在 Hadoop 中的大規模數據的機制。 Hive是SQL解析引擎,它將SQL語句轉譯成M/R Job然後在Hadoop執行。 Hive的表其實就是HDFS的目錄/文件,按表名把文件夾分開。如果是分區表,則分區值是子文件夾,可以直接在
相關文章
相關標籤/搜索