大數據-第12章 spark-streaming概況

1.流數據的特徵 答: ①數據快速持續到達,潛在大小也許是無窮無盡的; ②數據來源從多,格式複雜; ③數據量大,但不關注存儲,一旦經過處理,要麼丟棄,要麼歸檔存儲; ④注重數據的整體價值,不過分關注各別數據; ⑤數據順序顛倒,或者不完整,系統無法控制將要處理的新到達的數據元素的順序。 2.數據處理模式 答: ①批量處理:處理靜態數據,如hadoop; ②實時計算:處理流數據,如spark stre
相關文章
相關標籤/搜索