學習筆記 | 解析 Spark 數據處理與分析場景

數據處理場景 按照大數據的作業類型 在數據工程與數據科學中,很大一部分數據處理任務都可以被稱爲批處理(Batch Processing),所謂批處理,就是對數據進行批量處理,一次性對一定量的數據進行處理,根據數據量的大小,批處理從開始到結束的時間從數十秒到數小時都有可能,當然如果時間花費太長,還是會考慮優化、切分等,因爲這樣作業執行失敗的成本太高了。 批處理任務的輸入和輸出通常都是一批數據,在數據
相關文章
相關標籤/搜索