60TB 數據量的作業從 Hive 遷移到 Spark 在 Facebook 的實踐

時間 2021-08-15

原文原文鏈接

Facebook 經常使用分析來進行數據驅動的決策。在過去的幾年裏，用戶和產品都得到了增長，使得我們分析引擎中單個查詢的數據量達到了數十TB。我們的一些批處理分析都是基於 Hive 平臺（Apache Hive 是 Facebook 在2009年貢獻給社區的）和 Corona（ Facebook 內部的 MapReduce 實現）進行的。Facebook 還針對包括 Hive 在內的多個內部數據存

>>阅读原文<<