《Scala機器學習》一一2.5 數據驅動系統的基本組件

2.5 數據驅動系統的基本組件 簡單地說,一個數據驅動架構包含如下的組件(或者可精簡爲以下這些組件): 數據收集:需要從系統和設備上收集數據。大多數的系統有日誌,或者至少可選擇將日誌寫入本地文件系統。一些系統可以通過網絡來傳輸信息,比如syslog。但若沒有審計信息,缺少持久層意味着有可能丟失數據。 數據轉換層:也被稱爲提取、變換和加載(ETL)。現在數據轉換層也可以進行實時處理,即通過最近的數據
相關文章
相關標籤/搜索