Mining Data Streams(1)——數據流挖掘學習筆記

概述 數據流不一樣於數據庫,有幾個特色:數據流的實時性,致使其須要被當即處理,不然會永遠消失。同時通常數據量太大太快,動態存儲沒法存儲所有數據。因此在處理數據流的時候,通常會採用兩種算法:一、利用採樣和過濾的思想對流實時處理,去除沒必要要的元素。二、存儲固定長度的窗口,對進入窗口的元素進行整合、計算,而後再利用估計和機率提供近似的答案。算法 數據流模型 能夠看到這個模型中有數據數據流、流處理器、動
相關文章
相關標籤/搜索