Evernote Export
- 數據的分佈特徵能夠從三個方面進行測度和描述,一是分佈的集中趨勢,反映各數據向其中心值靠攏或彙集的程度;二是分佈的離散程度,反映各數據遠離其中心值的趨勢;三是分佈的形狀,反映數據分佈的偏態和峯態。
- 平均數在統計學中具備重要的地位,它是進行統計分析和統計推斷的基礎。從統計思想上看,平均數是一組數據的重心所在,是數據偏差相互抵消後的必然結果。
- 好比,對同一事物進行屢次測量,所得結果可能不一致,這是測量偏差所致,也多是其餘因素的偶然影響,利用平均數做爲其表明值,則能夠使偏差相互抵消,反映出事物必然性的數量特徵。
- 設下四分位數爲QL,上四分位數爲QU,根據四分位數的定義
QL=4nspa
QU=43norm
若是位置是整數,四分位數就是該位置對應的值,若是是在0.5的位置上,則取該位置兩側值的平均數,若是在0.25或0.75的位置上,則四分位數等於該位置的下側值加上按比例分攤位置兩側數值的差值。it
- 幾何平均數是適用於特殊數據的一種平均數。它主要用於計算平均比率。當所掌握的變量值自己是比率的形式時,採用幾何平均法計算平均比率更爲合理。在實際應用中,幾何平均數主要用於計算現象的平均增加率。
- 衆數是一組數據分佈的峯值,不受極端值的影響。其缺點是具備不惟一性,一組數據可能有兩個或多個衆數,也可能沒有衆數。衆數只有在數據量較多時纔有意義,當數據量較少時,不宜使用衆數。衆數主要適合做爲分類數據的集中趨勢測度值。
- 中位數是一組數據中間位置上的表明值,不受數據極端值的影響,當一組數據的分佈偏斜程度較大時,使用中位數也許是一個好的選擇。中位數主要適合做爲順序數據的集中趨勢測度值。
- 平均數是針對數值型數據計算的,並且利用了所有數據信息,它是實際中應用最普遍的集中趨勢測度值。當數據呈對稱分佈或接近對稱分佈時,3個表明值相等或接近相等,這時則應選擇平均數做爲集中趨勢的表明值。可是平均數的主要缺點是易受到數據極端值的影響,對於偏分佈的數據,平均數的表明性差。所以,當數據爲偏態分佈,特別是偏斜程度較大時,能夠考慮選擇中位數或衆數,這時它們的表明性比平均數好。
- 異衆比率主要用於衡量衆數對一組數據的表明程度。異衆比率越大,說明非衆數組的頻數佔總頻數的比重越大,衆數的表明性越差;異衆比率越小,說明非衆數組的頻數佔總頻數的比重越小,衆數的表明性越好。異衆比率主要適合測度分類數據的離散程度,固然,對於順序數據以及數值型數據也能夠計算異衆比率。
- 四分位差反映了中間50%數據的離散程度,其數值越小,說明中間的數據越集中,其數值越大,說明中間的數據越分散。四分位差不受極值的影響。此外,因爲中位數處於數據的中間位置,所以,四分位差的大小在必定程度上也說明了中位數對一組數據的表明程度。四分位差的大小在必定程度也說明了中位數對一組數據的表明程度。四分位差主要用於測度順序數據的離散程度。對於數值型數據也能夠計算四分位差,可是它不適合分類數據。
- 方差是各變量值與其平均數離差平方的平均數。方差(或標準差)能較好的反應出數據的離散程度,是實際中應用最廣的離散程度測度值。
- 標準分數給出了一組數據中各數值的相對位置。
- 離散係數也稱爲變異係數,它是一組數據的標準差與其相應的平均數之比。離散係數是測度數據離散程度的相對統計量,主要是用於比較不一樣樣本數據的離散程度。離散係數越大,說明數據的離散程度也大,離散係數越小,說明數據的離散程度也越小。
- 偏態係數
- 峯態係數