Hive--可執行SQL的Hadoop數據倉庫管理工具

Hive是一個基於HDFS的數據倉庫軟件,可理解爲數據庫管理工具;Hive的功能主要有: 1. 支持使用SQL對分佈式存儲的大型數據集進行讀、寫、管理,將SQL轉化成MapReduce任務執行; 2. 將數據結構映射到已存儲的數據中,即將存儲在HDFS上結構化的文件內容定義成Hive的外部表。 3. Hive提供了命令行的操作工具和JDBC的開發接口。 我們知道HBase也是基於HDFS的數據庫,
相關文章
相關標籤/搜索