如何區分批處理和流處理?

數據能夠抽象成兩種類型:無邊界數據 和 有邊界數據 無邊界數據,是一種不斷增加能夠說是無限的數據集,這類數據沒法判斷什麼時候終止,如:電商交易數據 有邊界數據,是一種有限的數據集,如:常見的保存好的數據web 從無邊界數據按時間窗口提取部分數據,就是有邊界數據,因此,有邊界數據能夠看作是無邊界的子集架構 在處理大數據時,一般還關心時域問題:事件時間 和 處理時間 事件時間,數據實際產生的時間 處理
相關文章
相關標籤/搜索