Spark Mllib裏如何將數值特徵字段用StandardScaler進行標準化(圖文詳解)

 首先,要明白爲什麼有時候,數值特徵字段需要進行標準化?   答:因爲,當我們若用迴歸分析算法時,必須將數值特徵字段進行標準化,這是因爲數值特徵字段單位不同,數字差異很大,所以無法彼此比較,這時,就需要使用標準化,使得數值特徵字段具有共同的標準。        加入數據標準化   withMean = false 本文轉自大數據躺過的坑博客園博客,原文鏈接:http://www.cnblogs.c
相關文章
相關標籤/搜索