機器學習tips:什麼是pipeline?

一個典型的機器學習構建包含若干個過程 一、源數據ETL 二、數據預處理 三、特徵選取 四、模型訓練與驗證 以上四個步驟能夠抽象爲一個包括多個步驟的流水線式工做,從數據收集開始至輸出咱們須要的最終結果。所以,對以上多個步驟、進行抽象建模,簡化爲流水線式工做流程則存在着可行性,對利用spark進行機器學習的用戶來講,流水線式機器學習比單個步驟獨立建模更加高效、易用。python 管道機制在機器學習算法
相關文章
相關標籤/搜索