數據預處理-對數變換

當數據發生傾斜時,可以使用特徵工程技巧,利用統計或數學變換來減輕數據分佈傾斜的影響。使原本密集的區間的值儘可能的分散,原本分散的區間的值儘量的聚合。 log 變換通常用來創建單調的數據變換。它的主要作用在於幫助穩定方差,應用 log 變換會傾向於拉伸那些落在較低的幅度範圍內自變量值的範圍,傾向於壓縮或減少更高幅度範圍內的自變量值的範圍。從而使得傾斜分佈儘可能的接近正態分佈並使得數據與分佈的平均值無
相關文章
相關標籤/搜索