Hive+Druid 實現快速查詢；迴歸分析是機器學習嗎；StructuredStreaming 可用於生產環境

時間 2021-07-13

標籤 hive druid machine-learning spark spark-streaming 欄目 Hadoop 简体版

原文原文鏈接

結合 Apache Hive 和 Druid 實現高速 OLAP 查詢 Hadoop 生態中，我們使用 Hive 將 SQL 語句編譯爲 MapReduce 任務，對海量數據進行操作；Druid 則是一款獨立的分佈式列式存儲系統，通常用於執行面向最終用戶的即席查詢和實時分析。 Druid 的高速查詢主要得益於列式存儲和倒排索引，其中倒排索引是和 Hive 的主要區別。數據表中的維度字段越多，查詢速

>>阅读原文<<