從不同的角度來認識和理解Impala的架構設計

時間 2020-12-21

原文原文鏈接

我們知道，在實時性要求不是很高的應用場景中，比如，月度統計報表生成等，我們基於傳統的Hadoop MapReduce來處理海量大數據（包括使用Hive），在各方面表現都還不錯，只需要離線處理數據，然後存儲結果即可。但是如果在一些實時性要求相對較高的應用場景中，哪怕處理時間能夠在原有的基礎有大幅度地減少，也能很好地提升用戶體驗。對於大數據的實時性要求，其實是相對的，比如，傳統使用MapReduce計

>>阅读原文<<