Spark 實戰,第 5 部分: 使用 ML Pipeline 構建機器學習工做流

引言 使用機器學習 (Machine Learning) 技術和方法來解決實際問題,已經被成功應用到多個領域,咱們常常可以看到的實例有個性推薦系統,金融反欺詐,天然語言處理和機器翻譯,模式識別,智能控制等。一個典型的機器學習機器學習過程一般會包含:源數據 ETL,數據預處理,指標提取,模型訓練與交叉驗證,新數據預測等。咱們能夠看到這是一個包含多個步驟的流水線式工做,也就是說數據從收集開始,要經歷多
相關文章
相關標籤/搜索