一、數據預處理——數據歸一化 & 數據標準化

1.1 數據無量綱化 在機器學習算法實踐中,我們往往有着將不同規格的數據轉換到同一規格,或不同分佈的數據轉換到某個特定分佈的需求,這種需求統稱爲將數據「無量綱化」。譬如梯度和矩陣爲核心的算法中,譬如邏輯迴歸,支持向量機,神經網絡,無量綱化可以加快求解速度;而在距離類模型,譬如K近鄰,K-Means聚類中,無量綱化可以幫我們提升模型精度,避免某一個取值範圍特別大的特徵對距離計算造成影響。(一個特例是
相關文章
相關標籤/搜索