目錄:html
1、點估計機器學習
一、矩估計法函數
二、順序統計量法學習
三、最大似然法atom
四、最小二乘法spa
2、區間估計.net
一、一個整體參數的區間估計:3d
二、兩個整體參數的區間估計:orm
3、樣本量的肯定xml
一、估計整體均值時樣本量的肯定
二、估計整體比例時樣本量的肯定
1、點估計
點估計是用樣本統計量來估計整體參數,由於樣本統計量爲數軸上某一點值,估計的結果也以一個點的數值表示,因此稱爲點估計。
點估計和區間估計屬於整體參數估計問題。何爲整體參數統計,當在研究中從樣本得到一組數據後,如何經過這組信息,對整體特徵進行估計,也就是如何從局部結果推論整體的狀況,稱爲整體參數估計。
一、矩估計法
利用樣本矩來估計整體中相應的參數。首先推導涉及感興趣的參數的整體矩(即所考慮的隨機變量的冪的指望值)的方程。而後取出一個樣本並從這個樣本估計整體矩。接着使用樣本矩取代(未知的)整體矩,解出感興趣的參數。從而獲得那些參數的估計。
最簡單的矩估計法是用一階樣本原點矩來估計整體的指望而用二階樣本中心矩來估計整體的方差。在尋找參數的矩法估計量時,對整體原點矩不存在的分佈如柯西分佈等不能用,另外一方面它只涉及整體的一些數字特徵,並未用到整體的分佈,所以矩法估計量實際上只集中了整體的部分信息,這樣它在體現整體分佈特徵上每每性質較差,只有在樣本容量n較大時,才能保障它的優良性,於是理論上講,矩法估計是以大樣本爲應用對象的。
若是整體中有 K個未知參數,能夠用前 K階樣本矩估計相應的前k階整體矩,而後利用未知參數與整體矩的函數關係,求出參數的估計量。
二、順序統計量法
順序統計量設是整體X的樣本,將它們自小到大排成
,則這個排列稱爲樣本順序統計量。抽取一個樣本
,便有一組自小到大的觀察值
三、最大似然法
四、最小二乘法
觀測值就是咱們的多組樣本,理論值就是咱們的假設擬合函數。目標函數也就是在機器學習中常說的損失函數,咱們的目標是獲得使目標函數最小化時候的擬合函數的模型。舉一個最簡單的線性迴歸的簡單例子,好比咱們有m個只有一個特徵的樣本:
樣本採用下面的擬合函數:。這樣咱們的樣本有一個特徵x,對應的擬合函數有兩個參數θ0和θ1須要求出。
目標函數爲:
用最小二乘法作什麼呢,使J(θ0,θ1)最小,求出使J(θ0,θ1)最小時的θ0和θ1,這樣擬合函數就得出了。
參考:https://www.cnblogs.com/pinard/p/5976811.html
2、區間估計
區間估計是在點估計的基礎上,給出整體參數估計的一個區間範圍,該區間一般由樣本統計量加減估計偏差獲得。與點估計不一樣,進行區間估計時,根據樣本統計量的抽樣分佈能夠對樣本統計量與整體參數的接近程度給出一個機率度量
1、一個整體參數的區間估計:轉自:https://blog.csdn.net/liangzuojiayi/article/details/78043658
二、兩個整體參數的區間估計:轉自:https://blog.csdn.net/liangzuojiayi/article/details/78044718
小樣本
3、樣本量的肯定 : 轉自:https://blog.csdn.net/rosa_zz/article/details/79562794
樣本中個體的數目或組成抽樣整體的單位數。
亦稱必要樣本單位數,是指知足調查目的要求的狀況下,至少須要選擇的樣本單位數。
一、估計整體均值時樣本量的肯定
1.重複抽樣
一旦肯定了置信水平(1-α),Zα/2的值就肯定了,對於給定的的值和整體標準差σ,就能夠肯定任一但願的容許偏差所須要的樣本容量。令E表明所但願達到的容許偏差,即:
由此能夠推到出肯定樣本容量的公式以下:
2.不重複抽樣
例:擁有MBA學位的研究生年薪的標準差大約爲4000 元,假定想要估計年薪95%的置信區間,但願容許偏差爲10000 元,應抽取多大的樣本容量?
二、估計整體比例時樣本量的肯定
1.重複抽樣
一旦肯定了置信水平(1-α),Zα/2的值就肯定了。因爲整體比例的值是固定的,因此容許偏差由樣本容量來肯定,樣本容量越大容許偏差就越小。估計的精度就越好。所以,對於給定的的π值,就能夠肯定任一但願的容許偏差所須要的樣本容量。令E表明所但願達到的容許偏差,即:
由此能夠推導出重複抽樣和無限整體抽樣條件肯定樣本容量的公式以下:
2.不重複抽樣
例:某社區想經過抽樣調查瞭解居民參加體育活動的比率,若是把偏差範圍設定在5%,問若是以95%的置信水平進行參數估計,須要多大的樣本?
肯定樣本容量的注意事項
1、在實際中採用不重複抽樣,但經常使用重複抽樣下的公式代替;
2、若和p未知,其處理方式是:
1.用過去近期的數據代替,
2.用樣本數據代替,
3.取p=0.5或最接近0.5的值;
3、對同一整體,若求出的Nx,Np不等,這時取較大的做爲必要樣本容量,
以同時知足作兩種調查的須要;
4、在實際工做中,常使用重複抽樣下的簡單隨機抽樣公式。