數據的統計分析與描述

統計的任務  -->  由樣本推斷整體函數

1.頻數表與直方圖  -->將數據取值劃分區間,統計每一個區間出現的次數orm

  1)讀入數據並轉換爲向量ci

  2)[N,X]=hist(Y,M)  Y行列都可、M爲劃分的份數,默認爲十、N返回M個小區間的頻數、X返回M個小區間的中點it

2.統計量  -->加工後的反應樣本數量特徵的函數pdf

  1)表示位置的統計量——算術平均值和中位數test

    mean(x)返回x的均值、median(x)返回中位數變量

  2)表示變異程度的統計量——標準差、方差和極差隨機數

    a.標準差  -->各個數據與均值偏離程度的度量  std(x)方法

    b.方差  -->標準差的平方  var(x)統計

    c.極差  -->最大值與最小值的差值  range(x)

  3)中心矩、表示分佈形狀的統計量——偏度和峯度  moment(x,order)返回order階中心距

    a.x的標準化變量(減去指望除以方差)的三階中心矩成爲偏度  -->反映了分佈的對稱性,>0爲右偏態,<0爲左偏態  skewness(x)

    b.四階中心距爲峯度  -->正態分佈的峯度爲3,若比3大的多,說明樣本中含有較多遠離均值的數據  kurtosis(x)

3.分佈函數、密度函數、上分位數:令分佈函數F(x)=1-α的x值

4.常見的幾個分佈

  1)正態分佈:0.68,0.95,0.997  norm

  2)卡方分佈:n個相互獨立的標準正態分佈變量的平方和服從卡方分佈  chi2

  3)t分佈  t

  4)F分佈  f

  5)Matlab提供5類函數:pdf機率密度、cdf分佈函數、inv分佈函數反函數、stat均值與方差、rnd隨機數生成

5.參數估計  已知整體的分佈,由樣本推斷整體的參數

  1)點估計  -->由樣本肯定整體參數的一個數值  評價:無偏性、最小方差性、有效性  方法:矩法、極大似然法

  2)區間估計  -->給出一個區間,使得待估參數落在此區間內的機率爲1-α,該區間成爲置信區間,1-α爲置信水平,α爲顯著性水平

    對於正態整體:[mu,sigma,muci,sigmaci]=normfit(x,alpha),x爲樣本,alpha爲顯著性水平

6.假設檢驗  對於整體的某些性質,提出假設,根據樣本對假設作出判斷是接受仍是拒絕

  1)方差已知,關於指望的檢驗(Z檢驗)  [h,p,ci]=ztest(x,mu,sigma,alpha,tail)  h=0對於H0接受,p表示在H0假設下樣本均值出現的機率,p越小H0越值得懷疑,ci是置信區間,tail是三種檢驗方式

  2)方差未知,關於指望的檢驗(t檢驗)  [h,p,ci]=ttest(x,mu,alpha,tail)

  3)兩個正態整體的均值差的檢驗  [h,p,ci]=ttest2(x,y,alpha,tail)  方差不等時:h=ttest2(x,y,alpha,tail,'unequal')

  4)分佈擬合檢驗

    a.卡方檢驗  H0:整體x的分佈函數是F(x)  若形式已知,參數未知,先用極大似然法估計參數,而後作檢驗

相關文章
相關標籤/搜索