1 數據 & 圖表

瞎逼逼:雖然是統計專業,但學藝不精。大學受過的專業訓練不多,妥妥學渣。所以工做後決定從新複習,閱讀材料爲賈俊平的《統計學》第7版。每週更新。
我不按照書裏的邏輯順序和全部知識點來寫個人筆記,我寫那些與個人工做比較有關的東西(想一想以後以爲能夠應用到工做中的數據的那些知識點),還會寫寫我以爲能夠怎樣應用到工做中,有些不太對的地方請你們多多指教~

 

第一週的內容是第3章:數據的圖表展現。
1 數據審覈:檢查數據是否有錯誤。(完整性和準確性(異常值))
2 比例與比率的區別
比例是各部分的數據與所有數據之比;
比率是不一樣類別數據之間的比值。
3 數據分組
單變量值分組:把每個值分紅一組。適合離散變量,且變量值較少時
組距分組:適合連續變量或變量值較多的狀況。
3.1 關於組距分組
步驟:
①肯定組數。5-15組。
②肯定各組的組距(各組的上限與下限之差)。組距=(最大值-最小值)/組數。
③根據分組編制頻數分佈表(組+頻數+頻率)。
分組原則:不重不漏。
①對於連續變量:
1.上組限不在內,a≤X<b.
2.對上一個組的上限值採用小數點的形式。eg.10~11.99,12~13.99
②對於離散變量:相鄰兩組的組限間斷。eg.140~149,150~159
若是所有數據的最大值和最小值與其餘數據相差很大,可使用開口組。
第一組:「xx如下」,最後一組:「XX以上」
不等距分組:好比對於年齡的分組。
實際工做應用:對商品的價格分段分組分析。毛利率、售罄率等

 

4 向上累積和向下累積 函數

 適用於順序數據,好比:不滿意、通常、滿意。  spa

 能夠作累積分佈圖。變量

 

上面簡單說說數據,下面 進入圖表內容:數據類型

 

5 總述數據類型與主要圖示方法方法

5.1 品質數據(如下均屬彙總表)統計

條形圖、餅圖、環形圖數據

5.2  數值型數據圖表

原始數據:莖葉圖、箱線圖異常

分組數據:直方圖di

時間序列數據:線圖

多變量數據:散點圖(二維)、氣泡圖(三維)、雷達圖(多維) 

 

 5.3 關於 直方圖

①左右兩邊的尾巴哪一邊偏長,這說明左(右)偏。

②與條形圖和柱狀圖的區別?

首先,橫着放的柱狀圖叫條形圖~

而後條形圖和直方圖的區別:

1. 條形圖是用長度表示頻數;直方圖是用面積表示各組頻數(由於還有不等距分組哦,因此是用面積~高度表示每一組的頻數,寬度表示每一組的組距);

2.因爲分組數據具備連續性,所以直方圖的各條柱子是靠一塊兒的,而柱形圖是分開的;

3.條形圖主要是展現分類數據,直方圖展現數值型數據。 

 

5.4 未分組數值型數據的適用圖形

莖葉圖 :展現數據的原始分佈

箱線圖:能夠展現數據的離散程度(經過箱線圖的形狀能夠看出數據分佈的特徵),更經常使用法是用於比較

關於箱線圖的一點小摘抄:箱線圖不能提供關於數據分佈偏態的精確度量,數據集較大時反映的形狀信息更加模糊,最好結合均值、標準差、偏度、分佈函數等來描述數據集的分佈形狀。

 

5.5 雷達圖能夠對比樣本各部分的類似度。 


 以上圖形在工做中的應用:

條形圖、餅圖、線圖很經常使用;

箱線圖、環形圖、直方圖、散點圖、氣泡圖、雷達圖、帕累託圖我還沒怎麼用過。

那我去研究一下使用公司的數據作出上面的圖來吧~而後看能不能發現有趣的東西。

跑路!

下期再見! 

相關文章
相關標籤/搜索