先作《統計學學習指導書》python
總結經驗:統計學第六版能夠分爲三部分。第一部分是1到3章介紹了統計學兩個分類之類描述統計數據,而5678章講述了推斷統計,其他張節介紹了數據統計的綜合應用的一些方法,如單雙因素法,等。。。到時候詳述學習
關於1-4節主要講述的內容:首先介紹了什麼是統計學,統計學主要分爲兩部分描述統計和推斷統計,介紹了數據的類型分類數據、順序數據、數值數據、界面數據,時序數據,觀測數據,實驗數據等;此外介紹了一下相關量,變量,整體,樣本,參數,統計量等與統計學息息相關的名詞spa
而後講述了統計學總要的數據如何蒐集,首先要抽樣肯定樣本單元,具體的抽樣有機率抽樣和非機率抽樣兩類,經過簡單抽樣,分層抽樣等一系列抽樣方式後,進行數據蒐集。數據蒐集也有許多不一樣的方式,注意數據蒐集過程的偏差合理控制非抽樣偏差,和抽樣偏差提升蒐集數據的精確度excel
數據蒐集到了須要進行數據的處理加工,先進行預處理找出不符和要求的數據,而後對數據進行篩選排序,作個透視圖看看數據的總體情況。而後對數據進行品質分析做圖,實現數據的可視化處理。對不一樣類型的數據使用不一樣的數據視圖進行表示,分類數據,順序數據,數值數據依次提升了數據的層次,高層次的數據表示不適用底層次的。具體分類數據能夠用條形圖,帕累託圖,餅圖,環狀圖來表示,屬性數據是累積頻數分佈圖表示,數值數值能夠用直方圖,莖葉圖,箱線圖表示。直方圖更直觀適用與大批量數據,莖葉圖適用於小批量數據,雷達圖,氣泡圖散點圖適用與多變量分析對象
對數據進行了可視化處理能宏觀整體把握數據的狀態分佈,但咱們更須要詳細的參數來具體刻畫出數據的狀態,這時就能夠用數據的歸納性度量對數據進行描述。描述主要的三個方面:數據的集中程度,數據的離散程度,數據的形狀偏度和峯度。集中度方面對於分類數據使用衆數對數據進行描述,順序數據能夠用中位數,分位數,四分位數進行描述統計,數值類型的數據可使用平均數進行描述,注意數據類型的層次依次遞增全部低層次的描述方式都適用於高層次的奧。在離散程度方面,咱們使用異衆比來描述分類數據,有四分位差描述順序數據,用極值,方差,經驗值,切比雪夫不等式來描述數據的離散波動狀況,對於不一樣對象的離散數據描述使用離散係數進行描述。對於偏度分析0表示對稱,大於1小於負1表示中度偏鋒,越接近0越好,對於峯度是相對正態分佈而言的,大於0尖峯,小於0扁平分佈。排序
對象統計描述這部分是對數據進行預處理的關鍵,實現對數據的一個可視化的處理和整體描述,爲之後的數據規律的觀察,關係的擬合,假設檢驗奠基了基礎,數據的統計描述是數據處理的關鍵一步,可使用python,matlab,excel、spass(本人大致會這些)等軟件進行一下處理。基礎
如發現錯誤歡迎留言指正,我也初學者,但願弄清楚統計學中的邏輯思路。變量