Hive讀書筆記(Hadoop 生態系統)

Hive是構建在hadoop上的數據倉庫工具,可以將結構化的數據文件映射爲一張數據庫表,也急速hi數據提取轉化加載(ETL),並提供簡單的SQL查詢功能,稱爲HQL(這邊要和Hibernate區別一下),允許熟悉SQL的用戶查詢數據。它是工作在thrift上的,控制分隔符也允許用戶指定數據格式。 Hive的特點 支持索引,加快數據查詢。 有不同的存儲類型,如HBase中的文件、純文本文件 將元數據
相關文章
相關標籤/搜索