1. t分佈形狀相似於標準正態分佈
2. t分佈是對稱分佈,較正態分佈離散度強,密度曲線較標準正態分佈密度曲線更扁平
3. 對於大型樣本,t-值與z-值之間的差異很小ide
做用
- t分佈糾正了未知的真實標準差的不肯定性
- t分佈明確解釋了估計整體方差時樣本容量的影響,是適合任何樣本容量均可以使用的合適分佈spa
應用
- 根據小樣原本估計呈正態分佈且方差未知的整體的均值
- 對於任何一種樣本容量,真正的平均值抽樣分佈是t分佈,所以,當存在疑問時,應使用t分佈code
樣本容量對分佈的影響
- 當樣本容量在 30-35之間時,t分佈與標準正態分佈難以區分
- 當樣本容量達到120時,t分佈與標準正態分佈實際上徹底相同了orm
自由度df對分佈的影響
- 樣本方差使用一個估計的參數(平均值),因此計算置信區間時使用的t分佈的自由度爲 n - 1
- 因爲引入額外的參數(自由度df),t分佈比標準正態分佈的方差更大(置信區間更寬)
- 與標準正態分佈曲線相比,自由度df越小,t分佈曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高
- 自由度df愈大,t分佈曲線愈接近正態分佈曲線,當自由度df= ∞ 時,t分佈曲線爲標準正態分佈曲線blog
圖表顯示t分佈ip
代碼:ci
1 # 不一樣自由度的學生t分佈與標準正態分佈 2 import numpy as np 3 from scipy.stats import norm 4 from scipy.stats import t 5 import matplotlib.pyplot as plt 6 7 print('比較t-分佈與標準正態分佈') 8 x = np.linspace( -3, 3, 100) 9 plt.plot(x, t.pdf(x,1), label='df=1') 10 plt.plot(x, t.pdf(x,2), label='df=20') 11 plt.plot(x, t.pdf(x,100), label = 'df=100') 12 plt.plot( x[::5], norm.pdf(x[::5]),'kx', label='normal') 13 plt.legend() 14 plt.show()
運行結果:event