數據預處理--無量綱化

1.無量綱化定義html

無量綱化,也稱爲數據的規範化,是指不一樣指標之間因爲存在量綱不一樣致其不具可比性,故首先需將指標進行無量綱化,消除量綱影響後再進行接下來的分析。學習

2.無量綱化方法優化

無量綱化方法有不少,可是從幾何角度來講能夠分爲:直線型、折線型、曲線形無量綱化方法。spa

(1)直線型無量綱化方法htm

直線型無量綱化方法是指指標原始值與無量綱化後的指標值之間呈現線性關係,經常使用的線性量化方法有閾值法、標準化法與比重法。blog

①閾值法是咱們最熟悉也最經常使用的一種無量綱化方法,閾值也稱臨界值,是指衡量事物發展變化的一些特殊指標值,如極大值、極小值等,而閾值法就是經過實際值與閾值對比獲得無量綱化指標值的方法。主要公式以及特色以下圖中所示。get

 

值得注意的一點,閾值參數的選取肯定卻會直接影響分析的結果,這裏需考慮實際狀況加上已有經驗進行探索,逐步優化,直到尋找最合適的閾值(最合適就是結果能夠達到讓本身滿意的程度)。搜索

②標準化方法就是指標原始值減去該指標的均值而後比上其標準差。方法

不管指標實際值是多少,最終將分佈在零的兩側,與閾值法相比,標準化方法利用樣本更多的信息,且標準化後的數據取值範圍將不在[0,1]之間。im

③比重法是將指標實際值轉化爲他在指標值總和中所佔的比重。

(2)折線型無量綱化方法

折線型無量綱化適用於被評價事物呈現階段性變化,即指標值在不一樣階段變化對事物整體水平影響是不同的。

雖然折線型無量綱化方法比直線型無量綱化方法更符合實際狀況,可是要想肯定指標值的轉折點不是一件容易的事情,須要對數據有足夠的瞭解和掌握。

(3)曲線形無量綱化方法

 有些事物發展的階段性變化並非很明顯,而前、中、後期的發展狀況又各不相同,就是說指標值的變化是按部就班的,並非突變的,在這種狀況下,曲線形無量綱化方法也更爲合適,經常使用的曲線形無量綱化方法以下圖所示:

(4)模糊無量綱化方法

綜合評價中的評價指標能夠分爲正向指標(即指標值越大越好)、逆指標(即指標值越小越好)和適度指標(即指標值落在某個區間最好,大了、小了都很差),指標彼此之間「好」與「壞」並無一個標準,在很大程度上具備必定的模糊性,這時候能夠選擇此方法對指標進行無量綱化處理,有興趣自行搜索學習。

 

本文參考: https://wenku.baidu.com/view/34187066f01dc281e53af0fc.html

相關文章
相關標籤/搜索