從不同的角度來認識和理解Impala的架構設計

我們知道,在實時性要求不是很高的應用場景中,比如,月度統計報表生成等,我們基於傳統的Hadoop MapReduce來處理海量大數據(包括使用Hive),在各方面表現都還不錯,只需要離線處理數據,然後存儲結果即可。但是如果在一些實時性要求相對較高的應用場景中,哪怕處理時間能夠在原有的基礎有大幅度地減少,也能很好地提升用戶體驗。對於大數據的實時性要求,其實是相對的,比如,傳統使用MapReduce計
相關文章
相關標籤/搜索