spark pipeline原理學習和記錄

概念 MLlib提供標準的機器學習算法API,可以方便的將不一樣的算法組合成一個獨立的管道,或者叫工做流。 • DataFrame:ML API使用Sark SQL中的DataFrme做爲機器學習數據集,可容納各類類型的數據,如DataFrame多是存儲文本的不一樣列,特徵向量,真正的標籤或者預測。       • 轉換器:Transformer是一種算法,能夠將一個DataFrame轉換成另外一
相關文章
相關標籤/搜索