60TB 數據量的作業從 Hive 遷移到 Spark 在 Facebook 的實踐

Facebook 經常使用分析來進行數據驅動的決策。在過去的幾年裏,用戶和產品都得到了增長,使得我們分析引擎中單個查詢的數據量達到了數十TB。我們的一些批處理分析都是基於 Hive 平臺(Apache Hive 是 Facebook 在2009年貢獻給社區的)和 Corona( Facebook 內部的 MapReduce 實現)進行的。Facebook 還針對包括 Hive 在內的多個內部數據存
相關文章
相關標籤/搜索