60TB 數據量的做業從 Hive 遷移到 Spark 在 Facebook 的實踐

時間 2020-05-15

標籤 60tb 數據 hive 遷移 spark 實踐欄目 Hadoop 简体版

原文原文鏈接

Facebook 常用分析來進行數據驅動的決策。在過去的幾年裏，用戶和產品都獲得了增加，使得咱們分析引擎中單個查詢的數據量達到了數十TB。咱們的一些批處理分析都是基於 Hive 平臺（Apache Hive 是 Facebook 在2009年貢獻給社區的）和 Corona（ Facebook 內部的 MapReduce 實現）進行的。Facebook 還針對包括 Hive 在內的多個內部數據存儲，

>>阅读原文<<