六西格瑪專案測量階段:機率與數理統計基礎

一、機率論基礎知識

許多決策都是在不確定的情況下做出的。例如,測量方法是否正確?過程能力能否達到要求?接收到的產品是否滿足預定的合格率要求?利用機率論可以解決這一系列問題,下面來明確機率的一些基本概念。

1.隨機試驗和隨機事件

在同一組條件下,對某事物或現象所進行的觀察或實驗稱為試驗,把觀察或實驗的結果稱為事件。廣義上講,從某一研究目的出發,對隨機現象進行觀察均稱為隨機試驗,但嚴格意義上的隨機試驗應該滿足三個條件:

(1)試驗可以在相同的條件下重複進行。

(2)試驗的所有可能結果是明確可知的,並且不止一個。

(3)每次試驗總是恰好出現這些可能結果中的一個,但試驗前不能肯定這次試驗會出現哪個結果。

隨機事件就是隨機試驗中可能出現也可能不出現的事件。特別地,每次隨機試驗一定出現的事件稱為必然事件,一定不會出現的事件稱為不可能事件。

2.事件間的關係與運算

(1)事件的包含與相等。

如果事件A出現一定導致事件B出現,則稱事件A包含於事件B,用記號ACB表示(見圖4——6)。例如,“電話交換臺一分鐘內接到的電話呼叫恰為指定次數”是一個隨機事件,可能是0,1,2,…。“接到呼叫2次”和“接到呼叫不超過5次”這兩個事件有明顯的關係,前者發生,後者一定發生,前者包含於後者,或者說後者包含了前者。如果ACB同時BCA,則稱事件A與事件B相等,用記號A=B表示。

六西格瑪專案測量階段:機率與數理統計基礎

(2)事件不相容。

事件A與事件B沒有共同的樣本點,則稱事件A與事件B不相容或稱事件A與事件B是互斥事件(見圖4—7)。例如,擲骰子時,出現1個點和出現2個點的結果不可能同時出現,即“出現1個點”和“出現2個點”是互斥事件。檢查一批產品,“恰有1件不合格品”和“恰有2件不合格品”是互斥事件。呼叫中心的客服人員“在5分鐘內接到過電話”和“在5分鐘內未接到電話”是互斥事件。

(3)事件的並。

由事件A與事件B中所有樣本點組成的新事件稱為事件A與事件B的並,記為AUB,是邏輯上“或”的關係(見圖4-8)。例如,在學校某一個班級內抽籤,A=“班幹部”,B=“女生”,則AUB=“班幹部或女生”;在電話交換臺,A=“接到呼叫1次”,B=“接到呼叫2次”,則AUB=“接到呼叫1次或2次”。

六西格瑪專案測量階段:機率與數理統計基礎

(4)事件的交。

由事件A與事件B中公共的樣本點組成的新事件稱為事件A與事件B的交,記為AOB或AB,是邏輯上“與”的關係(見圖4-9)。例如,在一個班級內抽籤,A=“班幹部”,B=“女生”,則AnB=“班幹部並且是女生”;在電話交換臺,A=“接到呼叫多於3次”,B=“接到呼叫少於5次”,則ANB=“接到呼叫4次”。

六西格瑪專案測量階段:機率與數理統計基礎

(5)事件的差

由在事件A中而不是在事件B中的樣本點組成的新事件稱為事件A對事件B的差,記為A-B(見圖4-10),同理可知B-A(見圖4-11)。仍以在一個班級內抽籤為例,A=“班幹部”,B=“女生”,則A-B=“班幹部但不是女生”;B-A=“女生但不是班幹部”。在電話交換臺,A=“接到呼叫多於3次”,B=“接到呼叫少於5次”,則A-B=“接到呼叫多於4次”,B-A=“接到呼叫少於4次”。

六西格瑪專案測量階段:機率與數理統計基礎

(6)對立事件。

假設所有的事件構成樣本空間為Q,在Q中而不在事件A中的樣本點組成的事件稱為事件A的對立事件,記為A(見圖4—12)。例如,檢查布匹時,事件A“至少有1個疵點”的對立事件A是“沒有疵點”。

3.機率

機率是對一個事件發生的可能性大小的度量,表示事件A發生可能性的數值P(A)稱為事件A的機率。拋擲一枚質地均勻的硬幣,“正面朝上”與“背面朝上”的可能性各為1/2。拋擲骰子時,“恰為6點”的可能性為1/6。機率是一個介於0~1的數,機率越大,事件發生的可能性越大;機率越小,事件發生的可能性越小。不可能事件的機率為0,必然事件的機率為1。

4.機率的性質和運演算法則

機率具有以下基本性質。

性質1:

對任一隨機事件A,有0≤P(A)≤1。

不可能事件的機率為0,必然事件的機率為1,即P()=0,P(Q)=1。例如拋擲骰子時,出現任何點數的機率p都是一個大於0小於1的正數。

性質2:

事件A的對立事件為A,有P(A)+P(A)=1。

例如,拋擲骰子,事件A=“出現點數3”,則A=“不出現點數3”,所以P(A)+P(A)=1,它表示拋擲骰子時,出現的點數要麼是3要麼不是3。

性質3:

若AつB,則P(A-B)=P(A)-P(B)。

例如,拋擲骰子,事件A=“出現點數小於3”,事件B=“出現點數1”,則AつB,所以P(A-B)=P(A)-P(B)。

性質4:

加法法則。

事件A與事件B的並的機率為P(AUB)=P(A)+P(B)-P(AB)。當事件A與事件B不相容時,P(AB)=O,則P(AUB)=P(A)+P(B)。

例如,拋擲骰子,事件A=“出現點數小於5”,事件B=“出現點數大於3”,則AUB=“出現點數為1~6中的任意一個數”,事件AB=“出現點數4”,所以P(AUB=P(A)+P(B)-P(AB)=4/6+3/6-1/6=1。當事件A=“出現點數小於2”,事件B=“出現點數大於5”時,事件A和事件B不相容,即P(AB)=0,所以P(AUB)=P(A)+P(B)=1/6+1/6=2/6

此性質可推廣到多個兩兩互不相容的隨機事件A1,A2,…,An,則P(A1UA2U…UAn)=P(A1)+P(A2)+…+P(Am)

性質5:

乘法法則。

對任意兩個事件A與B,有P(AB)=P(B|A)P(A)=P(A|B)P(B),其中P(A|B)為事件B發生條件下事件A發生的條件機率,此時要求P(B)>0。

例如,投擲骰子時,事件A=“出現點數大於2”,事件B=“出現點數小於4”,則P(A)=,P(B)=。當事件A發生時,即出現點數為3,4,5或6,此時事件B也發生的條件機率為P(B|A)=1,所以P(AB)=P(B|A)P(A)=1/4×4/6=1/6。同理可得,P(AB)=P(A|B)P(B)=1×品=,即P(AB)=P(B|A)P(A)=P(A|B)P(B)=1/6。

當兩個事件的發生互不影響,則稱這兩個事件相互獨立,即P(A|B)=P(A),P(B|A)=P(B),此時乘法原則簡化為:P(AB)=P(A)P(B)。

二、隨機變數及分佈

1.隨機變數

因此,隨機變數,即按照一定的機率取值的變數,通常用大寫字母X,Y,Z等表示,而隨機變數的取值通常用小寫字母x,y,z等表示。隨機變數通常具有以下兩個特徵:

(1)取值的隨機性,即事先不能確定X取哪個值。

(2)取值的統計規律性,即可確定X取某個數值或X在某一區間內取值的機率。

通常我們只研究兩類隨機變數:離散型隨機變數和連續型隨機變數。

2.離散型隨機變數和分佈

如果隨機變數X所有可取值集合只包括有限或可列個元素集合,則X為離散型隨機變數。如拋硬幣得到正或反面的次數、鑄件上的缺陷數等都是離散型隨機變數。其中:P(X=xi)=pi為離散型隨機變數X的機率函式。其分佈列表如下:

六西格瑪專案測量階段:機率與數理統計基礎

3.連續型隨機變數和分佈

如果隨機變數X能在一個數值區間內取任何值,則X為連續型隨機變數。如燈泡、電視機等電器的使用壽命等都是連續型隨機變數。對於連續型隨機變數,我們一般用機率密度函式來表示其分佈情況。假設

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

其中,隨機變數X小於或等於實數x的機率F(x)=P(X≤x),則有

六西格瑪專案測量階段:機率與數理統計基礎

F(x)又稱為累積分佈函式或分佈函式,如圖4-15陰影部分所示。

六西格瑪專案測量階段:機率與數理統計基礎

由於在計算面積時,直線的面積為0,即P(X=a)=0,所以有

六西格瑪專案測量階段:機率與數理統計基礎

指數分佈是一種常見的連續分佈,其機率密度函式為:

六西格瑪專案測量階段:機率與數理統計基礎

式中,A>0,為引數。在工程實踐中,不少產品首次發生故障的時間,或發生故障後需要維修的時間都服從指數分佈。

三、數學期望、均值及方差

均值(mean)、方差(variance)與標準差(standard deviation)均為描述資料分佈狀況的重要指標。均值用來表示分佈的中心位置,反映分佈的集中情況,用E(X)表示。均值的計算公式為:

六西格瑪專案測量階段:機率與數理統計基礎

很多情況下僅瞭解集中程度是不夠的,還必須瞭解隨機變數的離散特徵。我們通常使用方差度量分佈的離散程度,記方差為Var(X),其計算公式如下:

六西格瑪專案測量階段:機率與數理統計基礎

標準差σ是方差Var(X)的正平方根,與變數X具有相同的單位,也用來反映離散程度的大小,記為σ=σ(X)=Var(X)。

均值與方差具有以下性質:

(1)設X為隨機變數,a與b為任意實數,則有E(aX+b)=aE(X)+b,var(ax+b)= a2var(x)的值。

(2)對任意兩個隨機變數X1和X2,有E(X1+X2)=E(X1)+E(X2);如果X1和X2獨立,則有Var(X1土X2)=Var(X1)+Var(X2)。

四、常用的離散分佈

常用的離散分佈有:

●0-1分佈(0-1分佈)。

●二項分佈(二項分佈)。

●執行下列操作吳成祖(魚的分佈)。

●超幾何分佈(超幾何分佈)。

1. 0-1分佈

當每次試驗中,只有兩種可能的結果,例如正面朝上與背面朝上,產品合格與不合格,檢驗透過與不透過,目標命中與不命中,具備某特性與不具備某特性等,或是隻關注試驗的兩種不同結果,例如手機月話費是否高於100元,布匹疵點數是否多於5個等,可以將這兩種結果稱為成功與失敗。若成功的機率為p,則失敗的機率為1-p,設隨機變數X表示“試驗的結果”,則X服從兩點分佈。若把成功記為1,失敗記為0,則稱X服從0-1分佈,記為X~B(1,p)。

六西格瑪專案測量階段:機率與數理統計基礎

0—1分佈的均值、方差與標準差分別為:

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

五、常用的連續分佈

常見的連續分佈有:

正態分佈;

均勻分佈;

指數分佈;

對數正態分佈;

威布林分佈。

正態分佈

質量管理中最常用的連續分佈是正態分佈,它能夠描述很多質量特性隨機取值的統計規律性。正態分佈的機率密度函式為:

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

2.均勻分佈

設連續隨機變數X具有機率密度函式為:

六西格瑪專案測量階段:機率與數理統計基礎

則稱X在區間(a,b)上服從均勻分佈,記為X~U(a,b),如圖4—24所示。如果變數X在區間(a,b)上服從均勻分佈,意味著X落在區間(a,b)中任意長度相同的子區間內的可能性相同。均勻分佈U(a,b)的均值、方差與標準差分別為:

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

3.指數分佈

設連續型隨機變數X的機率密度函式為:

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

在地質勘探中,岩石的某種化學成分的對數服從正態分佈,故得名對數正態分佈。對數正態分佈出現在很多領域,如針刺麻醉的陣痛效果、英語單詞的長度、流行病的蔓延時間、某些電器的壽命、化學反應時間、絕緣材料的被擊穿時間、產品維修時間,等等。

5.威布林分佈

威布林分佈在可靠性工程中廣泛應用,尤其適用於機電類產品的磨損累計失效的分佈形式。由於可以利用機率紙很容易地推斷出它的分佈引數,所以廣泛應用於各種壽命試驗的資料處理。其機率密度函式為:

六西格瑪專案測量階段:機率與數理統計基礎

六西格瑪專案測量階段:機率與數理統計基礎

六、中心極限定理

假設隨機變數X1和X2相互獨立,且X1和X2同分布,即X1和X2具有相同的分佈形狀和分佈引數,則稱X1和X2是獨立同分布的隨機變數。

六西格瑪專案測量階段:機率與數理統計基礎

當Xi的分佈對稱時,只要n≥5近似效果就比較理想;當Xi的分佈非對稱時,一般n≥30近似效果才比較理想。根據中心極限定理,可用多次測量的方法對樣本均值進行更精確的估計。