機率論是研究隨機現象數量規律的數學分支。隨機現象是相對於決定性現象而言的。在必定條件下必然發生某一結果的現象稱爲決定性現象。例如在標準大氣壓下,純水加熱到100℃時水必然會沸騰等。隨機現象則是指在基本條件不變的狀況下,每一次試驗或觀察前,不能確定會出現哪一種結果,呈現出偶然性。例如,擲一硬幣,可能出現正面或反面。隨機現象的實現和對它的觀察稱爲隨機試驗。隨機試驗的每一可能結果稱爲一個基本事件,一個或一組基本事件統稱隨機事件,或簡稱事件。典型的隨機試驗有擲骰子、扔硬幣、抽撲克牌以及輪盤遊戲等。
事件的機率是衡量該事件發生的可能性的量度。雖然在一次隨機試驗中某個事件的發生是帶有偶然性的,但那些可在相同條件下大量重複的隨機試驗卻每每呈現出明顯的數量規律。
傳統機率
傳統機率又叫拉普拉斯機率,由於其定義是由法國數學家
拉普拉斯提出的。若是一個隨機試驗所包含的單位事件是有限的,且每一個單位事件發生的可能性均相等,則這個隨機試驗叫作拉普拉斯試驗。在拉普拉斯試驗中,事件A在事件空間S中的機率P(A)爲:
例如,在一次同時擲一個硬幣和一個骰子的隨機試驗中,假設事件A爲得到國徽面且點數大於4,那麼事件A的機率應該有以下計算方法:S={(國徽,1點),(數字,1點),(國徽,2點),(數字,2點),(國徽,3點),(數字,3點),(國徽,4點),(數字,4點),(國徽,5點),(數字,5點),(國徽,6點),(數字,6點)},A={(國徽,5點),(國徽,6點)},按照拉普拉斯定義,A的機率爲2/12=1/6,注意到在拉普拉斯試驗中存在着若干的疑問,在現實中是否存在着這樣一個試驗,其單位事件的機率具備精確的相同的機率值,由於人們不知道,硬幣以及骰子是否"完美",即骰子製造的是否均勻,其重心是否位於正中心,以及輪盤是否傾向於某一個數字等等。儘管如此,傳統機率在實踐中被普遍應用於肯定事件的
機率值,其理論根據是:若是沒有足夠的論據來證實一個事件的機率大於另外一個事件的機率,那麼能夠認爲這兩個事件的機率值相等。 若是仔細觀察這個定義會發現拉普拉斯用機率解釋了機率,定義中用了"相同的可能性"(原文是égalementpossible)一詞,其實指的就是"相同的機率"。這個定義也並無說出,到底什麼是機率,以及如何用數字來肯定機率。在現實生活中也有一系列問題,不管如何不能用傳統機率定義來解釋,好比,人壽保險公司沒法肯定一個50歲的人在下一年將死去的機率等。
公理化定義
如何定義機率,如何把機率論創建在嚴格的
邏輯基礎上,是機率理論發展的困難所在,對這一問題的探索一直持續了3個世紀。20世紀初完成的
勒貝格測度與積分理論及隨後發展的抽象測度和積分理論,爲
機率公理體系的創建奠基了基礎。在這種背景下,蘇聯數學家
柯爾莫哥洛夫1933年在他的《機率論基礎》一書中第一次給出了機率的
測度論的定義和一套嚴密的
公理體系。他的
公理化方法成爲現代機率論的基礎,使機率論成爲嚴謹的數學分支,對機率論的迅速發展起了積極的做用。
如下是公理化定義:
設隨機實驗E的
樣本空間爲Ω。若按照某種方法,對E的每一事件A賦於一個實數P(A),且知足如下公理:
1°非負性:P(A)≥0;
2°規範性:P(Ω)=1;
3°可列(徹底)可加性:對於兩兩互不相容的可列無窮多個事件A1,A2,……,An,……,有
,則稱實數P(A)爲事件A的機率。
統計定義
設隨機事件A在n次重複試驗中發生的次數爲nA,若當試驗次數n很大時,頻率nA/n穩定地在某一數值p的附近擺動,且隨着試驗次數n的增長,其擺動的幅度愈來愈小,則稱數p爲隨機事件A的機率,記爲P(A)=p。
相關事例
人們廣泛認爲,對將要發生的機率的一種很差的感受,或者說不安全感(俗稱「點背」)是實際存在的。下面列出的幾個例子能夠形象闡述人們有時對機率存在的錯誤的認識:
機率論
1.六合彩:在六合彩(49選6)中,一共有13983816種可能性(參閱
組合數學),廣泛認爲,若是每週都買一個不相同的號,最晚能夠在13983816/52(周)=268919年後得到頭等獎。事實上這種理解是錯誤的,由於每次中獎的機率是相等的,中獎的可能性並不會由於時間的推移而變大。
2.生日悖論:在一個足球場上有23我的(2×11個運動員和1個裁判員),難以想象的是,在這23人當中至少有兩我的的生日是在同一天的機率要大於50%。
3.輪盤遊戲:在遊戲中玩家廣泛認爲,在連續出現屢次紅色後,出現黑色的機率會愈來愈大。這種判斷也是錯誤的,即出現黑色的機率每次是相等的,由於球自己並無「記憶」,它不會意識到之前都發生了什麼,其機率始終是18/37。
4.三門問題:在電視臺舉辦的猜隱藏在門後面的汽車的遊戲節目中,在參賽者的對面有三扇關閉的門,其中只有一扇門的後面有一輛汽車,其它兩扇門後是山羊。遊戲規則是,參賽者先選擇一扇他認爲其後面有汽車的門,可是這扇門仍保持關閉狀態,緊接着主持人打開沒有被參賽者選擇的另外兩扇門中後面有山羊的一扇門,這時主持人問參賽者,要不要改變主意,選擇另外一扇門,以使得贏得汽車的機率更大一些?
正確結果是,若是參賽者改變初衷,他的中獎機率將變成2/3。由於打開山羊門的那一剎那,原本的選擇結果已經從1/3概率變到了1/2概率,若是改變初衷此時將是1/2中獎的概率。
有三種可能的狀況,所有都有相等的可能性(1/3)︰參賽者挑山羊一號,主持人挑山羊二號。轉換將贏得汽車。參賽者挑山羊二號,主持人挑山羊一號。轉換將贏得汽車。參賽者挑汽車,主持人挑兩頭山羊的任何一頭。轉換將失敗。在頭兩種狀況,參賽者能夠經過轉換選擇而贏得汽車。第三種狀況是惟一一種參賽者經過保持原來選擇而贏的狀況。由於三種狀況中有兩種是經過轉換選擇而贏的,因此經過轉換選擇而贏的機率是2/3。[1]
事件
單位事件、事件空間、隨機事件
在一次隨機試驗中可能發生的惟一的,且相互之間獨立的結果被稱爲單位事件,用e表示。在隨機試驗中可能發生的全部單位事件的集合稱爲事件空間,用S來表示。例如在一次擲骰子的隨機試驗中,若是用得到的點數來表示單位事件,那麼一共可能出現6個單位事件,則事件空間能夠表示爲S={1,2,3,4,5,6}。 上面的事件空間是由可數有限單位事件組成,事實上還存在着由可數無限以及不可數單位事件組成的事件空間,好比在一次直到得到
國徽面朝上的隨機擲硬幣試驗中,其事件空間由可數無限單位事件組成,表示爲:S={國,數國,數數國,數數數國,數數數數國,···},注意到在這個例子中"數數數國"是單位事件。將兩根筷子隨意扔向桌面,其靜止後所造成的
交角假設爲α,這個隨機試驗的事件空間的組成能夠表示爲
。
隨機事件是事件空間S的
子集,它由事件空間S中的單位元素構成,用大寫字母A,B,C...表示。例如在擲兩個骰子的隨機試驗中,設隨機事件A="得到的點數和大於10",則A能夠由下面3個單位事件組成:A={(5,6),(6,5),(6,6)}。 若是在隨機試驗中事件空間中的全部可能的單位事件都發生,這個事件被稱爲
必然事件,表示爲
;相應的若是事件空間裏不包含任何一個單位事件,則稱之爲不可能事件,表示爲
。
事件的計算
由於事件在必定程度上是以
集合的含義定義的,所以能夠把集合
計算方法直接應用於事件的計算,也就是說,在計算過程當中,能夠把事件看成集合來對待。
A的補集
不屬於A的事件發生
|
聯集A∪B
或者A或者B或者A,B同時發生
|
交集A∩B
事件A,B同時發生
|
差集A\B
不屬於B的A事件發生
|
空集A∩B=∅
A,B事件不一樣時發生
|
子集B⊆A
如A發生,則B也必定發生
|
在輪盤遊戲中假設A表明事件「球落在紅色區域」,B表明事件"球落在黑色區域",C表明事件"球落在綠色區域",由於事件A和B沒有共同的單位事件,所以可表示爲機率P(AB)=0。
注意到事件A和B並非互補的關係,由於在整個事件空間S中還有一個單位事件C,其即不是紅色也不是黑色,而是綠色,所以A,B的補集應該分別表示以下:
以及
。
條件機率
一事件A在一事件B肯定發生後會發生的機率稱爲B給之A的
條件機率;其數值爲
(當
時)。若B給之A的條件機率和A的機率相同時,則稱A和B爲
獨立事件。
機率論
且A和B的此一關係爲對稱的,這能夠由一同價敘述:「當A和B爲獨立事件時,P(A∩B)=P(A)P(B)」看出。
須要說起的是下面將要介紹的9個計算機率的定理與上面已經說起的事件的計算沒有關係,全部關於機率的定理均由機率的3個公理得來,同時適用於包括拉普拉斯機率和統計機率在內的全部機率理論。
定理1
(互補法則)
與A互補事件的機率始終是1-P(A)。
第一次旋轉紅色不出現的機率是19/37,按照
乘法法則,第二次也不出現紅色的機率是
,所以在這裏互補機率就是指在兩次連續旋轉中至少有一次是紅色的機率,爲
定理2
不可能事件的機率爲零。
證實: Q和S是互補事件,按照公理2有P(S)=1,再根據上面的定理1獲得P(Q)=0
定理3
若是A1...An事件不能同時發生(爲互斥事件),並且若干事件A1,A2,...An∈S每兩兩之間是空集關係,那麼這些全部事件
集合的機率等於單個事件的機率的和。
定理4
定理5
(任意事件加法法則)
對於事件空間S中的任意兩個事件A和B,有以下定理: 機率
定理6
(乘法法則) 事件A,B同時發生的機率是:
,前提爲事件A,B有必定關聯。
定理7
(無關事件乘法法則)
兩個不相關聯的事件A,B同時發生的機率是:注意到這個定理其實是定理6(乘法法則)的特殊狀況,若是事件A,B沒有聯繫,則有P(A|B)=P(A),以及P(B|A)=P(B)。觀察一下輪盤遊戲中兩次連續的旋轉過程,P(A)表明第一次出現紅色的機率,P(B)表明第二次出現紅色的機率,能夠看出,A與B沒有關聯,利用上面提到的公式,連續兩次出現紅色的機率爲:
忽視這必定理是形成許多玩家失敗的根源,廣泛認爲,通過連續出現若干次紅色後,黑色出現的機率會愈來愈大,事實上兩種顏色每次出現的機率是相等的,以前出現的紅色與以後出現的黑色之間沒有任何聯繫,由於球自己並無"記憶",它並不"知道"之前都發生了什麼。
統計機率是創建在頻率理論基礎上的,分別由英國邏輯學家約翰(John Venn,1834-1923)和
奧地利數學家理查德(Richard VonMises,1883-1953)提出,他們認爲,得到一個事件的機率值的惟一方法是經過對該事件進行100次,1000次或者甚至10000次的先後相互獨立的n次隨機試驗,針對每次試驗均記錄下絕對頻率值和相對頻率值hn(A),隨着試驗次數n的增長,會出現以下事實,即相對頻率值會趨於穩定,它在一個特定的值上下浮動,也便是說存在着一個
極限值P(A),相對頻率值趨向於這個極限值。
例如,若想知道在一次擲骰子的隨機試驗中得到6點的機率值能夠對其進行3000次先後獨立的扔擲試驗,在每一次試驗後記錄下出現6點的次數,而後經過計算相對頻率值能夠獲得趨向於某一個數的統計機率值。
扔擲數
|
得到6點的絕對頻率
|
得到6點的相對頻率
|
1
|
1
|
1.00000
|
2
|
1
|
0.50000
|
3
|
1
|
0.33333
|
4
|
1
|
0.25000
|
5
|
2
|
0.40000
|
10
|
2
|
0.20000
|
20
|
5
|
0.25000
|
100
|
12
|
0.12000
|
200
|
39
|
0.19500
|
300
|
46
|
0.15333
|
400
|
72
|
0.18000
|
500
|
76
|
0.15200
|
600
|
102
|
0.17000
|
700
|
120
|
0.17143
|
1000
|
170
|
0.17000
|
2000
|
343
|
0.17150
|
3000
|
560
|
0.16867
|
上面提到的這個有關相對頻率的經驗值又被稱爲
大數定律,是頻率理論學家定義機率論的基礎。然而沒有人能夠將骰子無限的扔下去,所以在實踐中也就沒法有力的證實大數定律,許多來自數學理論的論證至今也沒有取得成功。儘管如此,統計機率在今天的實踐中具備重要意義,它是
數理統計的基礎。
n個事件H1,H2,...Hn互相間獨立,且共同組成整個事件空間S,即
,並且
。這時A的機率能夠表示爲
例如,一個隨機試驗工具由一個骰子和一個櫃子中的三個抽屜組成,抽屜1裏有14個
白球和6個黑球,抽屜2裏有2個白球和8個黑球,抽屜3裏有3個白球和7個黑球,試驗規則是首先擲骰子,若是得到小於4點,則抽屜1被選擇,若是得到4點或者5點,則抽屜2被選擇,其餘狀況選擇抽屜3。而後在選擇的抽屜裏隨機抽出一個球,最後抽出的這個球是白球的機率是:
P(白)=P(白|抽1)·P(抽1)+P(白|抽2)·P(抽2)+P(白|抽3)·P(抽3)
=(14/20)·(3/6)+(2/10)·(2/6)+(3/10)·(1/6)
=28/60=0.4667
從例子中可看出,徹底機率特別適合於分析具備
多層結構的隨機試驗的狀況。
貝葉斯定理由英國數學家貝葉斯(Thomas Bayes,1702-1761)發展,用來描述兩個條件機率之間的關係,好比P(A|B)和P(B|A)。按照定理6的乘法法則,
,能夠馬上導出貝葉斯定理:
如上公式也可變形爲例如:
。[2]
一座別墅在過去的20年裏一共發生過2次被盜,別墅的主人有一條狗,狗平均每週晚上叫3次,在盜賊入侵時狗叫的機率被估計爲0.9,問題是:在狗叫的時候發生入侵的機率是多少?
人們假設A事件爲狗在晚上叫,B爲盜賊入侵,則
,
,
,按照公式很容易得出結果:
。
另外一個例子,現分別有A,B兩個容器,在容器A分別有7個紅球和3個白球,在容器B裏有1個紅球和9個白球,現已知從這兩個容器裏任意抽出了一個球,且是紅球,問這個紅球是來自容器A的機率是多少?
假設已經抽出紅球爲事件B,從容器A裏抽出球爲事件A,則有:
,
,
,按照公式,則有:
。
雖然機率論最先產生於17世紀,然而其公理體系卻在20世紀的20至30年代才創建起來並獲得迅速發展,在過去的半個世紀裏機率論在愈來愈多的新興領域顯示了它的應用性和實用性,例如:物理、化學、生物、醫學、心理學、社會學、政治學、教育學,經濟學以及幾乎全部的
工程學等領域。
特別值得一提的是,機率論是今天數理統計的基礎,其結果常被用作問卷調查的分析資料,並且也用於對經濟前景進行預測。