視覺化推導貝葉斯定理公式

什麼是貝葉斯定理?

在統計和應用數學中,貝葉斯定理也被稱為貝葉斯規則,它是一個用於確定事件的偶然性機率的數學公式。貝葉斯定理描述了由事件相關條件的先驗知識支援的事件發生的機率。

視覺化推導貝葉斯定理公式

這個定理以英國統計學家貝葉斯的名字命名,他在1763年發現了這個公式。它被認為是被稱為貝葉斯推斷的特殊統計推斷方法的靈感。

除了統計學之外,貝葉斯定理還被用於醫學和藥理學等各個學科。該理論通常用於多個金融領域。例如模擬向借款人貸款的風險或預測投資成功的可能性。

解釋

視覺化推導貝葉斯定理公式

在上面的圖片中,我們有兩個重疊的事件A和B。例如,A-我今天被弄溼了,B-今天會下雨。在一種或另一種方法中,許多事件彼此關聯,如我們的示例中所示。只要B已經發生,讓我們計算A的機率。因為B發生了,所以陰影部分是對A重要的也就是是A∩ B、 所以,給定B的機率似乎是:

視覺化推導貝葉斯定理公式

因此,如果 A 已經發生,我們可以寫出事件 B 的公式:

視覺化推導貝葉斯定理公式

或者:

視覺化推導貝葉斯定理公式

現在,第二個公式可以改寫為:

視覺化推導貝葉斯定理公式

這就是貝葉斯定理公式其中

P(A|B) — 給定事件 B 已經發生時事件 A 發生的機率。

P(B|A) — 給定事件 A 已經發生時事件 B 發生的機率。

P(A) — 事件 A 單獨發生的機率。

P(B) — 事件 B 單獨發生的機率。

貝葉斯定理的例子

假設您是一家投資銀行的證券分析師。與你對上市公司的研究一致,在過去三年內股價上漲了 5% 的企業中,有 60% 的企業在此期間更換了 CEO。與此同時,同期股價漲幅未達到5%的企業中,只有35%更換了CEO。知道股票價格在 4% 中上漲 5% 的機率,找出解僱 CEO 的公司的股票將增加 5% 的機率。

在找到機率之前,必須首先定義機率的表示法。

P(A) — 股價上漲 5% 的機率。

P(B) — CEO 被替換的機率。

P(A|B) — 假設 CEO 已被更換,股價上漲 5% 的機率。

P(B|A)——考慮到股價上漲 5%,CEO 更換的機率。

使用貝葉斯定理,我們將找到指定的機率:

視覺化推導貝葉斯定理公式

因此,更換 CEO 的公司的股票增長 5% 的機率為 6。67%。

視覺化講解複雜案例

上面的例子很簡單,但是為了更好的理解,下面使用一個複雜的例子視覺化推理貝葉斯公式:

一家工廠使用三臺機器(A、B 和 C)生產產品,它們分別佔其產量的 20%、30% 和 50%。 在機器 A 生產的產品中,有 5% 是有缺陷的; 同樣,機器 B 的 3% 的物品和機器 C 的 1% 有缺陷。 如果隨機選擇的物品有缺陷,它是由機器 A 生產的機率是多少?

讓我們先畫出這個場景的視覺表現:

視覺化推導貝葉斯定理公式

在上述場景中,我們的樣本空間 U 由給定工廠生產的所有物品組成,並由圖中的外部矩形邊界表示。 矩形 A、B 和 C 代表機器 A、B 和 C 生產物品的事件,Da、Db 和 Dc 分別代表 A、B 和 C 生產的物品有缺陷的事件。

此外,我假設矩形 U 的高 h=1所以使用我們的面積,Area(U) = 1。。 那麼我們有,

wa + wb + wc = 1                                                 (1)

同樣根據我們的面積假設,機器 A 生產的物品數量與矩形 A 的面積成正比,即

機器A生產的物品數量 =Area(A)

因此,根據機率的定義,機器 A 生產物品的機率,P(A) = 機器生產的物品數量 A ÷ 生產的物品總數,

P(A) = Area(A)/Area(U)

因為Area(U) = 1

P(A) = Area(A) = wa * h = wa                                     (2)

相似地,

P(B) = wb ,P(C) = wc。

P(Da) = Area(Da),P(Db) = Area(Db) , P(Dc) = Area(Dc)

如果我們分別取這些矩形 D 的高度為 ha、hb 和 hc,

那麼P(Da) = wa * ha ,其他也類似。

假設我們知道A已經發生的場景,那麼樣本空間就變成

視覺化推導貝葉斯定理公式

現在給定 A 發生 D 的機率將由下式給出

P(D|A) = Area(Da)/Area(A)

或者

P(D|A) = wa*ha/wa*h

這樣

P(D|A) = ha/h                                                           (3)

現在我們考慮場景的第二部分,即假設從樣本空間 U 中隨機抽樣的專案有缺陷。 在這種情況下,我們的樣本空間現在將縮小到上圖中的灰色陰影區域,由矩形 Da、Db 和 Dc 組成,因為缺陷專案只能屬於該區域。我們的新樣本空間現在的樣子如下:

視覺化推導貝葉斯定理公式

如果現在我們必須找出機率 P(A|D),即給定缺陷產品來自機器 A 的機率,我們很容易看出這可以用面積寫成

P(A|D) = Area(Da) / (Area(Da) + Area(Db) + Area(Dc))

如果我們將分子和分母都除以Area(U) =1,我們得到

P(A|D) = Area(Da)/Area(U) / (Area(Da)+Area(Db)+Area(Dc))/ Area(U)

其中Area(Da)/Area(U) 是 P(Da),分母項是 P(D) 。

所以我們得到

P(A|D) = P(Da)/P(D)                                              (4)

我們假設矩形 Da 的高度是 ha ,那麼

P(Da) = Area(Da) = wa * ha

將項除以 h,矩形 U(或 A)的高度,

P(Da) = (wa * ha * h)/h

P(Da) = wa * (ha/h) //  h=1刪除了

現在從上面的等式(2),我們知道 wa = P(A),等式(3),ha/h = P(D|A)。

所以將這些代入等式(2)我們得到

P(A|D) = P(D|A) x P(A) / P(D)

這是不是跟貝葉斯公式一樣了

請注意,儘管我對樣本空間和區域做了一些假設,但在現實世界的場景中,總是可以像這樣表示我們的實驗,其中隨機事件的形狀或區域表示它們的機率。 我實際上是從使用機率估計面積的蒙特卡洛方法中獲得了這個想法,並將其顛倒過來以使用面積來表示機率。