大數據-第12章 spark-streaming概況

時間 2021-01-05

標籤大數據 spark 欄目 Spark 简体版

原文原文鏈接

1.流數據的特徵答: ①數據快速持續到達，潛在大小也許是無窮無盡的； ②數據來源從多，格式複雜； ③數據量大，但不關注存儲，一旦經過處理，要麼丟棄，要麼歸檔存儲； ④注重數據的整體價值，不過分關注各別數據； ⑤數據順序顛倒，或者不完整，系統無法控制將要處理的新到達的數據元素的順序。 2.數據處理模式答: ①批量處理：處理靜態數據，如hadoop； ②實時計算：處理流數據，如spark stre

>>阅读原文<<