引言html
【比較官方的簡介】數理統計學是一門以機率論爲基礎,應用性很強的學科。它研究怎樣以有效的方式收集、 整理和分析帶有隨機性的數據,以便對所考察的問題做出正確的推斷和預測,爲採起正確的決策和行動提供依據和建議。數理統計不一樣於通常的資料統計,它更側重於應用隨機現象自己的規律性進行資料的收集、整理和分析。數據結構
【簡單的講】,就是經過樣本分析來推斷總體。大數據
【意義或者重要性】在這個大數據時代,數據是很是重要的。怎樣挖掘數據內部的規律或者隱含的信息,變得尤其重要。當時咱們是不可能得到總體的數據的,因此咱們只能經過抽取樣本,進而經過樣原本推斷總體的規律。spa
【目錄】3d
第一章、樣本與統計量htm
1、引言:blog
2、整體與樣本:get
3、統計量:數據分析
4、經常使用分佈:基礎
1、引言:
2、點估計——矩估計法:
3、點估計——極大似然估計:
4、估計量的優良性準則
5、區間估計——正態分佈
一、引入
二、單個正態整體參數的區間估計
三、兩個正態整體的區間估計
六、區間估計——非正態分佈:
一、大樣本正態近似法
二、二項分佈
三、泊松分佈
1、引言:
2、正態整體均值的假設檢驗
一、單正態整體 N(μ, σ2)均值 μ 的檢驗
(1) 雙邊檢驗 H0: μ = μ0;H1: μ≠μ0
(2) 單邊檢驗 H0: μ = μ0;H1: μ>μ0
二、兩個正態整體 N(μ1, σ12) 和 N(μ2, σ22)均值的比較
(1) 雙邊檢驗 H0: μ1 = μ2;H1: μ1≠μ2
(2) 單邊檢驗 H0: μ1 >= μ2;H1: μ1<μ2
(3) 單邊檢驗 H0: μ1 <= μ2;H1: μ1>μ2
三、正態整體方差的檢驗
一、單個正態整體方差的 χ2 檢驗
(1) H0: σ2 =σ02;H1: σ2 ≠σ02
(2) H0: σ2 =σ02;H1: σ2 >σ02
(3) H0: σ2 ≤σ02;H1: σ2 > σ02 (同2.)
二、兩正態整體方差比的 F 檢驗
(1). H0: σ12 = σ22;H1: σ12 ≠ σ22.
(2) H0: σ12 = σ22;H1: σ12> σ22
(3) H0: σ12 ≤ σ22;H1: σ12> σ22
1、引言
四、估計與預測
(1) E(y0)的估計
(2) y0的預測區間
三、廣義線性迴歸模型
四、非線性迴歸模型
1、引言
第五章、方差分析
1、引言:
方差分析是研究一種或多種因素的變化對試驗結果的觀測值是否有顯著影響,從而找出較優的試驗條件或生產條件的一種經常使用數理統計方法。
【方差分析的另一種提法】實際工做中咱們常常碰到多個正態整體均值的比較問題,處理這類問題一般採用所謂的方差分析方法;即不一樣因素水平產生多個正態分佈,方差分析就是這多個正態分佈進行分析。
【例1】在飼料養雞增肥的研究中,某研究所提出三種飼料配方:A1是以魚粉爲主的飼料,A2是以槐樹粉爲主的飼料,A3是以苜蓿粉爲主的飼料。爲比較三種飼料的效果,特選 24 只類似的雛雞隨機均分爲三組,每組各喂一種飼料,60天后觀察它們的重量。試驗結果以下表所示:
本例中,咱們要比較的是三種飼料對雞的增肥做用是否相同。爲此,把飼料稱爲因子,記爲A,三種不一樣的配方稱爲因子A的三個水平,記爲A1, A2, A3,使用配方Ai下第 j 只雞60天后的重量用yij表示,i=1, 2, 3, j=1, 2,..., 10。咱們的目的是比較三種飼料配方下雞的平均重量是否相等,爲此,須要作一些基本假定,把所研究的問題歸結爲一個統計問題,而後用方差分析的方法進行解決。
2、單因子方差分析的統計模型 :
在例1中咱們只考察了一個因子,稱其爲單因子試驗。
一般,在單因子試驗中,記因子爲 A, 設其有r個水平,記爲A1, A2,…, Ar,在每一水平下考察的指標能夠當作一個整體 ,現有 r 個水平,故有 r 個整體, 假定:
咱們要比較各水平下的均值是否相同,
即要對以下的一個假設進行檢驗: H0 :μ1 =μ2 =…=μr (1)
備擇假設爲 H1 :μ1, μ2, …, μr 不全相等
在不會引發誤解的狀況下, H1 一般可省略不寫。
若是H0成立,因子A的r個水平均值相同,稱因子A的r個水平間沒有顯著差別,簡稱因子A不顯著;反之,當H0不成立時,因子A的r個水平均值不全相同,這時稱因子A的不一樣水平間有顯著差別,簡稱因子A顯著。
爲對假設(1)進行檢驗,須要從每一水平下的整體抽取樣本,設從第i個水平下的整體得到m個試驗結果,記 yij 表示第i個整體的第j次重複試驗結果。共得以下n=r×m個試驗結果:
yij, i=1, 2,…, r , j=1, 2, …, m, 其中r爲水平數,m爲重複數,i爲水平編號,j 爲重複編號。
在水平Ai下的試驗結果yij與該水平下的指標均值 μi 通常老是有差距的,記 εij = yij-μi,eij 稱爲隨機偏差。因而有:yij = μi +εij (2)
(2)式稱爲試驗結果 yij 的數據結構式。
【單因子方差分析的統計模型】
3、平方和分解:
1、一般在單因子方差分析中可將試驗數據列成以下表格形式:
二、組內誤差與組間誤差:
三、誤差平方和及其自由度:
【重要】誤差平方和與自由度的關係,接下來三個自由度均可由此推出!
四、總平方和分解公式
組內誤差平方和自由度計算以下:每組的自由度都爲(m-1),則總共r組,因此總自由度爲 (m-1)*r = m*r -r = n-r
五、檢驗方法
4、參數估計
在檢驗結果爲顯著時,咱們可進一步求出總均值μ 、各主效應ai和偏差方差σ2的估計
一、點估計:正態分佈的極大似然估計
由於 E(Se)= σ2 * (n-r) ;因此 E(Se/n)= σ2 * (n-r)/n ≠ σ2 ,因此不知足無偏性,更具體關於無偏性,可查看【第二章、參數估計-4、估計量的優良性準則】
二、置信區間
紅框部分證實以下:根據【第一章、樣本與統計量-中心極限定理】證實以下:
【總結】在單因子試驗的數據分析中可獲得以下三個結果:
Ø 因子是否顯著;
Ø 試驗的偏差方差σ2的估計;
在因子A顯著時,一般只需對較優的水平均值做參數估計,在因子A不顯著場合,參數估計無需進行。
5、重複數不等情形
單因子方差分析並不要求每一個水平下重複試驗次數全相等,在重複數不等場合的方差分析與重複數相等狀況下的方差分析極爲類似,只在幾處略有差異。
六、多重比較
一、效應差的置信區間:
若是方差分析的結果因子A顯著,則等於說有充分理由認爲因子A各水平的效應不全相同,但這並非說它們中必定沒有相同的。就指定的一對水平Ai與Aj,咱們可經過求μi - μj的區間估計來進行比較。
這裏的置信區間與兩樣本的t區間基本一致,區別在於這裏σ2的估計使用了所有樣本而不只僅是兩個水平Ai, Aj下的觀測值。
二、多重比較問題
在進行方差分析時要求r個方差相等,這稱爲方差齊性。理論研究代表,當正態性假定不知足時對F檢驗影響較小,即F檢驗對正態性的偏離具備必定的穩健性,而F檢驗對方差齊性的偏離較爲敏感。因此r個方差的齊性檢驗就顯得十分必要。
所謂方差齊性檢驗是對以下一對假設做出檢驗:
不少統計學家提出了一些很好的檢驗方法,這裏介紹幾個最經常使用的檢驗,它們是: