伯努利實驗:less
若是無窮隨機變量序列 是獨立同分布(i.i.d.)的,並且每一個隨機變量 都服從參數爲p的伯努利分佈,那麼隨機變量 就造成參數爲p的一系列伯努利試驗。一樣,若是n個隨機變量 獨立同分布,而且都服從參數爲p的伯努利分佈,則隨機變量 造成參數爲p的n重伯努利試驗。機器學習
伯努利試驗是隻有兩種可能結果的單次隨機試驗。ide
- 若是試驗E是一個伯努利試驗,將E獨立重複地進行n次,則稱這一串重複的獨立試驗爲n重伯努利試驗。
1、伯努利分佈:函數
伯努利分佈亦稱「零一分佈」、「兩點分佈」。稱隨機變量X有伯努利分佈, 參數爲p(0<p<1),若是它分別以機率p和1-p取1和0爲值。EX= p,DX=p(1-p)。伯努利試驗成功的次數服從伯努利分佈,參數p是試驗成功的機率。伯努利分佈是一個離散型機率分佈,是N=1時二項分佈的特殊狀況,爲記念瑞士科學家詹姆斯·伯努利(Jacob Bernoulli 或James Bernoulli)而命名。學習
例子:假定重複拋擲一枚均勻硬幣,若是在第i次拋擲中出現正面,令 ;若是出現反面,令 ,那麼,隨機變量 就造成參數爲 的一系列伯努利試驗,一樣,假定由一個特定機器生產的零件中10%是有缺陷的,隨機抽取n個進行觀測,若是第i個零件有缺陷,令 ;若是沒有缺陷,令 ,那麼,隨機變量 就造成參數爲 的n重伯努利試驗 (百度百科)
網站
E(X)=p, E(X2)=q , Var(X)=pqspa
2、二項分佈:.net
n 次Bernoulli試驗的結果中,每次試驗的分佈不變,結果爲1的次數 X 的分佈。就是重複n次的伯努利實驗。3d
在機率論和統計學裏面,帶有參數n和p的二項分佈表示的是n次獨立試驗的成功次數的機率分佈。在每次獨立試驗中只有取兩個值,表示成功的值的機率爲p,那麼表示試驗不成功的機率爲1-p。這樣一種判斷成功和失敗的二值試驗又叫作伯努利試驗。orm
特殊地,當n=1的時候,咱們把二項分佈稱爲伯努利分佈。
超幾何分佈,n 次伯努利試驗,每次試驗分佈發生改變,結果爲1的次數 X 的分佈,當試驗分佈變化不大的時候和二項分佈結果相同
它描述了從有限N個物件(其中包含M個指定種類的物件)中抽出n個物件,成功抽出該指定種類的物件的次數(不放回)
泊松分佈的參數λ是單位時間(或單位面積)內隨機事件的平均發生次數。 泊松分佈適合於描述單位時間內隨機事件發生的次數。
k事件X發生的頻數;P(X=k)事件X發生k次的機率
泊松分佈的指望和方差均爲
特徵函數爲
當二項分佈的n很大而p很小時,泊松分佈可做爲二項分佈的近似,其中λ爲np。一般當n≧20,p≦0.05時,就能夠用泊松公式近似得計算,當n趨近於無窮的時候等同於二項分佈。
5、多項分佈
是二項式分佈的推廣。二項式作n次伯努利實驗,規定了每次試驗的結果只有兩個,若是如今仍是作n次試驗,只不過每次試驗的結果能夠有多m個,且m個結果發生的機率互斥且和爲1,則發生其中一個結果X次的機率就是多項式分佈。
扔骰子是典型的多項式分佈。扔骰子,不一樣於扔硬幣,骰子有6個面對應6個不一樣的點數,這樣單次每一個點數朝上的機率都是1/6(對應p1~p6,它們的值不必定都是1/6,只要和爲1且互斥便可,好比一個形狀不規則的骰子),重複扔n次,若是問有k次都是點數6朝上的機率。
6、負二項分佈
一種離散機率分佈。知足如下條件的稱爲負二項分佈:實驗包含一系列獨立的實驗, 每一個實驗都有成功、失敗兩種結果,成功的機率是恆定的,實驗持續到r次成功,r爲正整數。
7、gamma分佈
是統計學的一種連續機率函數。
gamma函數定義:
Γ(x) = ∫0∞ tx-1 e-t dt Γ(x+1) = x Γ(x); Γ(x+1) = x!
Gamma分佈中的參數α稱爲形狀參數(shape parameter),β稱爲逆尺度參數(scale parameter)
8、指數分佈
指數分佈是事件的時間間隔的機率。如:
-
嬰兒出生的時間間隔
-
來電的時間間隔
-
奶粉銷售的時間間隔
-
網站訪問的時間間隔
是描述泊松過程當中的事件之間的時間的機率分佈,即事件以恆定平均速率連續且獨立地發生的過程。 這是伽馬分佈的一個特殊狀況,它是幾何分佈的連續模擬,它具備無記憶的關鍵性質。
指數函數的一個重要特徵是無記憶性(Memoryless Property,又稱遺失記憶性)。這表示若是一個隨機變量呈指數分佈,當s,t>0時有P(T>t+s|T>t)=P(T>s)。即,若是T是某一元件的壽命,已知元件使用了t小時,它總共使用至少s+t小時的條件機率,與從開始使用時算起它使用至少s小時的機率相等。
指望值: ,方差: 若隨機變量x服從參數爲λ的指數分佈,則記爲 。
9、卡方分佈
若n個相互獨立的隨機變量ξ₁,ξ₂,...,ξn ,均服從標準正態分佈(也稱獨立同分佈於標準正態分佈),則這n個服從標準正態分佈的隨機變量的平方和 構成一新的隨機變量,其分佈規律稱爲卡方分佈(chi-square distribution)。其中參數 稱爲自由度。記爲 或者 (其中 , 爲限制條件數)。
卡方分佈是由正態分佈構造而成的一個新的分佈,當自由度 很大時, 分佈近似爲正態分佈。
1) 分佈在第一象限內,卡方值都是正值,呈正偏態(右偏態),隨着參數 的增大, 分佈趨近於正態分佈;卡方分佈密度曲線下的面積都是1.
2) 分佈的均值與方差能夠看出,隨着自由度 的增大,χ2分佈向正無窮方向延伸(由於均值 愈來愈大),分佈曲線也愈來愈低闊(由於方 愈來愈大)。
10、Beta分佈
B函數,又稱爲Beta函數或者第一類歐拉積分,是一個做爲伯努利分佈和二項式分佈的共軛先驗分佈的密度函數,是指一組定義在(0,1) 區間的連續機率分佈,定義以下:
有兩個參數
實例:
11、幾何分佈
是離散型機率分佈。在n次伯努利試驗中,試驗k次才獲得第一次成功的機率。詳細地說,是:前k-1次皆失敗,第k次成功的機率。幾何分佈是帕斯卡分佈當r=1時的特例。
12、學生分佈(t分佈)
用於根據小樣原本估計呈正態分佈且方差未知的整體的均值。若是整體方差已知(例如在樣本數量足夠多時),則應該用正態分佈來估計整體均值。
t分佈曲線形態與n(確切地說與自由度df)大小有關。與標準正態分佈曲線相比,自由度df越小,t分佈曲線愈平坦,曲線中間愈低,曲線雙側尾部翹得愈高;自由度df愈大,t分佈曲線愈接近正態分佈曲線,當自由度df=∞時,t分佈曲線爲標準正態分佈曲線。
十3、正態分佈
十4、狄利克雷分佈
狄利克雷分佈(Dirichlet distribution)是多項分佈的共軛分佈,也就是它與多項分佈具備相同形式的分佈函數。同時能夠看作是將Beta分佈推廣到多變量的情形。一類在實數域以正單純形(standard simplex)爲支撐集(support)的高維連續機率分佈,是Beta分佈在高維情形的推廣。
對獨立同分布(independent and identically distributed, iid)的連續隨機變量 和支撐集 ,若 服從狄利克雷分佈,則其機率密度函數
是分佈參數的和,
是多元Beta函數(multivariate beta function),
爲Gamma函數。由上述解析形式可知,狄利克雷分佈是指數族分佈 [1] 。
應用
泊松分佈和負二項分佈用途區分
https://www.jianshu.com/p/ad24bb90b972--------------------- 原文:https://blog.csdn.net/tonyshengtan/article/details/82947416