大數據分佈式數據處理系統,主要分爲哪兩種?

大數據的處理模式分爲流處理和批處理兩種。流處理是直接處理,批處理採用先存儲再處理。   流處理將數據視爲流,源源不斷的數據形成數據流。當新的數據到來即立即處理並返回所需的結果。大數據的實時處理是一個極具挑戰性的工作,數據具有大規模、持續到達的特點。因此,如果要求實時的處理大數據,必然要求採用分佈式的方式,在這種情況下,除了應該考慮分佈式系統的一致性問題,還將涉及到分佈式系統網絡時延的影響,這都增加
相關文章
相關標籤/搜索