轉載:http://blog.sina.com.cn/s/blog_60be90250100eojy.htmlhtml
在謝寧方法(Shainin Approach)中,圖基(Tukey)檢驗被普遍用於驗證質量改進的有效性。Tukey檢驗的一個重要的優勢是很是簡單,並且所需實驗樣本相對較少。其檢驗結果的可信度達到95%的置信水平時,最少的狀況下只需6個樣本進行驗證(改善前3個樣本、改善後3個樣本)。運用Tukey檢驗無需掌握複雜的統計學知識,所以,生產一線的操做工也容易掌握。ide
Tukey檢驗首先計算終結計數(EC: End Count),再查對終結計數的臨界值,若所計算的終結計數值大於某一置信水平下的終結計數臨界值,則認爲在該置信水平下改善前和改善後的質量存在差別,不然不能肯定在該置信水平下存在差別。url
舉例:spa
假設在製程採起改進措施前統計了某生產線上連續10個班的產品合格率分別爲:89.7%,81.4%,84.5%,84.8%,87.3%,79.7%,85.1%,81.7%,83.7%,84.5%。製程採起改進措施後連續統計的10個班的產品合格率分別爲:84.7%,86.1%,83.2%,91.9%,86.3%,79.3%,82.6%,89.1%,83.7%,88.%。初看起來,採起改進措施後平均產品合格率爲85.54%,比採起改進措施前提升了1.3%(採起改進措施前平均產品合格率爲84.24%)。那麼到底採起改進措施以後是否有比較顯著的改善效果呢?咱們運用Tukey檢驗方法來作驗證:xml
第一步:咱們把製程採起改進措施前的合格率用A標記,採起改進措施後的合格率用B標記htm
第二步:將這20個數據按從小到大的順序排序,獲得以下結果:blog
第三步:計算終結計數。按Tukey理論,採起改進措施先後產品合格率若發生顯著變化,則A,B兩系列的數據就不會徹底重疊,未重疊的數據個數即爲終結計數。分別從頂端和底端計數未重疊的數據個數,稱之爲頂端終結計數和底端終結計數,兩端終結計數之和即爲總終結計數。若某一系列的數據區間被另外一比對系列的數據區間所有包含,則總終結計數計爲零(如本例所示);若兩系列的數據區間不存在一個系列徹底包含另外一個系列的情況,則計數方法爲:從已合併排序的整個數據列的頂端第一個數據開始數起,一直數到序列標記變動爲止,連續的同系列數據的個數爲頂端終結計數;若在數據系列變動時,對應的兩個數據相等,則變動時的那個數據按1/2計數。同理,從底端第一個數據開始數起,一直到序列標記變動爲止,可得底端終結計數值。示例以下:排序
第四步:將所得的終結計數值與Tukey檢驗的某置信水平下終結計數的臨界值比較,若是所得的終結計數值大於該臨界值,則代表採起改進措施後,在該置信水平下能夠認爲產品合格率發生了變化。(下圖中的顯著水平針對的雙邊計數(Two-Sided),若單邊計數(One-Sided)則對應的顯著水平爲圖示的一半,即雙邊計數時顯著水平5%對應的終結計數臨界值與單邊計數時顯著水平爲2.5%對應的終結計數臨界值是同樣的)get
第五步:結論。終結計數EC=0,而根據上表能夠看出,在95%的置信水平(也就是5%的顯著水平)下,終結計數的臨界值爲7。因此在95%的置信水平下,不能認爲採起措施後,產品合格率發生了顯著變化。若是終結計數EC=8,則代表在95%的置信水平下,能夠認爲採起措施後,產品合格率發生了顯著變化(改進有效果)。產品
如今咱們用Minitab中的2樣本t檢驗方法來作檢驗。示例中的第一種情形終結計數EC=0時,對應的t檢驗結果以下:
該檢驗的零假設是「採起改進措施先後產品合格率沒有顯著變化」。t檢驗的p值爲39%,代表若是拒絕零假設,犯第一類錯誤的機率高達39%,所以不能拒絕零假設。也就是說,不能認爲採起改進措施後,產品合格率發生了顯著變化。從95%的置信區間包括0值來看,咱們能夠認爲「產品合格率未發生顯著變化」的結論其置信水平可達95%。
示例中的第二種情形下,t檢驗的結果以下:
此時,t檢驗的p值爲1.7%,代表若是拒絕零假設,犯第一類錯誤的機率只有1.7%,所以可以拒絕零假設。也就是說,能夠認爲採起改進措施後,產品合格率發生了顯著變化。從95%的置信區間不包括0值來看,咱們能夠認爲「產品合格率發生顯著變化」的結論其置信水平可達95%。
因而可知,t檢驗的結果與Tukey檢驗的結果是等效的,但Tukey檢驗不須要藉助專門的統計軟件就能夠由一線操做工來完成。正由於如此,我對Tukey檢驗倍加推崇。