From:http://zhengzhengiristang.spaces.live.com/Blog/cns!5C49491E8BB6E8BD!308.entryide
未分組數據-直方圖 ui
數值型數據表現爲數字,在整理時一般進行數據分組。分組是根據統計研究的須要,將數據按照某種標準分紅不一樣的組別。直方圖是用矩形的寬度和高度來表示頻數分佈的圖形。用橫軸表示數據分組,縱軸表示頻數或頻率。
例9 某地1993年抽樣調查了110名18歲男大學生的身高(cm)資料。如今關注的指標是身高的分佈。
SAS程序:spa
引用:orm |
data height; |
未分組數據-莖葉圖
對於未分組的原始數據,咱們能夠用莖葉圖來顯示其分佈的特徵。莖葉圖由「莖」和「葉」兩部分構成,其圖形是由數字組成的。經過莖葉圖,能夠看出數據的分佈形狀及數據的離散情況,好比分佈是否對稱,數據是否集中,是否有極端值等。
例10 將20名鉤端螺旋體病人的血清隨機分爲兩組,分別用標準株和水生株作凝溶試驗,測得稀釋倍數以下:
標準株:100 200 400 400 400 400 800 1600 1600 1600 3200
水生株:100 100 100 200 200 200 200 400 400
用莖葉圖初步考察標準株的分佈。
SAS程序:get
引用:input |
data beishu; |
未分組數據-箱線圖
箱線圖是由一組數據的5個特徵值繪製而成的,它由一個箱子和兩條線段組成。5個特徵值依次是最大值、上四分位數、中位數、下四分位數和最小值。經過箱線圖,能夠反映出數據分佈的特徵。
箱線圖通常有單批數據箱線圖和多批數據箱線圖兩種。
1) 單批數據箱線圖
例11 同例10數據,用箱線圖初步考察標準株的分佈。
SAS程序:table
引用:form |
data beishu; |
2) 多批數據箱線圖
對於多批數據,咱們能夠將各批數據的箱線圖並列起來,從而進行分佈特徵的比較。
例12 同例10數據,用多批數據箱線圖初步比較標準株、水生株的的分佈。
SAS程序:
引用: |
data beishu; |
未分組數據-散點圖
表示兩種事物變量的相關性和趨勢。醫學上經常使用於觀察兩種生理指標之間的動態變化關係,或臨牀上兩項檢測結果之間的量變關係。
例13 某地抽樣調查了31名18歲男大學生的體重(kg)和肺活量資料。如今關注的指標是體重和肺活量之間的相關性。
SAS程序:
引用: |
data wo; |
時間序列數據-間隔圖形
當觀測按日期或時間排列時,數據就構成時間序列數據。咱們通常採用「Timeplot」過程對一個或幾個變量繪製時間間隔的散點圖。間隔圖形的類型通常有單個變量的間隔圖形和多個變量的間隔圖形兩種。
1) 單個變量的間隔圖形
例14 現有1940-1974年間美國和全世界的肺癌死亡率數據[2]:
1940 1950 1960 1965 1970 1972 1973 1974
美國 12.6 10.0 14.2 15.0 10.2 13.7 13.0 11.5
世界 31.2 30.6 46.2 55.0 53.6 62.9 63.3 64.3
用間隔圖形初步考察美國的死亡率分佈。
SAS程序:
引用: |
data cancer; |
2) 多個變量的間隔圖形
例15 同例15數據,用間隔圖形初步比較美國和世界的死亡率分佈。
SAS程序:
引用: |
data cancer; |
地域性數據-統計地圖
利用SAS的GMAP能夠在地圖上製做二維或三維的統計圖,直觀地顯示地區性的
差別。
例16 繪製截至2003年6月1日SARS確證病例各省分佈圖。
引用: |
data sars; |
綜上所述,雖然統計軟件SAS可以幫助咱們繪製各類類型的統計圖,可是不一樣類型的統計圖是不能混用的,必須遵照必定的原則和要求,因此咱們在做圖前要搞清楚數據類型、所適用的統計圖,而後再運用相應的SAS程序做圖。