60TB 數據量的做業從 Hive 遷移到 Spark 在 Facebook 的實踐

Facebook 常用分析來進行數據驅動的決策。在過去的幾年裏,用戶和產品都獲得了增加,使得咱們分析引擎中單個查詢的數據量達到了數十TB。咱們的一些批處理分析都是基於 Hive 平臺(Apache Hive 是 Facebook 在2009年貢獻給社區的)和 Corona( Facebook 內部的 MapReduce 實現)進行的。Facebook 還針對包括 Hive 在內的多個內部數據存儲,
相關文章
相關標籤/搜索