股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

股民修養 共1028講 博弈論 第十九講 博弈論的納什均衡及其求解方法

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

第十九講 博弈論的納什均衡及其求解方法

一、納什均衡的定義

納什均衡是在博弈

G={s1 ,…,sn ;u1 ,…,un }

中,如果各博弈方

i

的某策略

si*

與其他博弈方的策略組成策略組合

(si*,s-i*),

且任一博弈方

i

的策略

si*

都是對其餘博弈方策略的最優反應,即

ui(si*,s-i*)≥ ui(si*,s-i*)(si*≠si)

,則稱

(si*,s-i*)

為該博弈的一個納什均衡。特別地,當且僅當

(si*,s-i*)

是納什均衡,且對所有純策略

(si*≠si)

ui(si*,s-i*)

ui(si*,s-i*)

,又稱

(si*,s-i*)

是 嚴格(強)納什均衡。

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

納什均衡是最常見的均衡。它的含義是:在對方策略確定的情況下,每個參與人的策略都是最好的,此時沒有人願意先改變自己的策略。納什均衡是博弈論中的重要概念,同時也是經濟學的重要概念。

二、納什均衡的性質

納什均衡是所有博弈方的最優策略的組合:給定該策略中別人的選擇,沒有人有積極性改變自己的選擇。

(一)一致預測性

納什均衡是一種策略組合,使得每個參與人的策略都是對其他參與人策略的最優反應。納什均衡是博弈將會如何進行的一致(

consistent)

預測,一 致即各博弈方的實際行為選擇與他們的預測一致。這是指,如果所有參與人預測特定納什均衡會出現,那麼沒有參與人有動力採用與均衡不同的行動。因此納什均衡(也只有納什均衡)具有使得參與人能預測到它的性質,並預測到他們的對手也會預測到它,如此繼續。與之相反,任何固定的非納什均衡如果出 現就意味著至少有一個參與人“犯了錯”,可能是對對手行動的預測犯了錯,也可能是(給定那種預測)在最大化自己的收益時犯了錯。

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

(二)自動實施性

為了理解納什均衡的哲學含義,讓我們設想n個參與人在博弈之前達成一個協議,規定每一個參與人選擇一個特定的策略。我們要問的一個問題是,給定其他參與人都遵守這個協議,在沒有外在強制的情況下,是否有任何人有動力不遵守這個協議?顯然,只有當遵守協議帶來的效用大於不遵守協議的效用時,一個人才會遵守這個協議。如果沒有任何參與人有動力不遵守這個協議,我們說這個協議是可以自動實施的(self-enforcing),這個協議就構成一個納什均衡;否則,它就不是一個納什均衡。

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

三、納什均衡的基本解法

(一)劃線法

劃線法的基本思想是博弈方先找出自己針對其他博弈方每種策略或策略組合的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得益的策略;然後在此基礎上,透過對其他博弈方策略選擇的判斷,包括對其他博弈方對自己策略判斷的判斷等,預測博弈的可能結果和確定自己的最優策略。

具體方法是對其他博弈方的任一策略組合,找出博弈方

i

的最優策略,並在其得益值下劃一小橫線;若存在一個這樣的策略組合,所有博弈方的得益值下都劃了線,則該策略組合就是該博弈的一個納什均衡。

下面舉例說明劃線法的應用。

約會博弈:

小莉

足球 芭蕾

大海

足球

芭蕾

分析過程:

如果大海選足球,小莉的相對佔優策略也是足球,這比她選芭蕾好,這時在小莉的得益值1下劃線。

如果大海選芭蕾,小莉的相對佔優策略也一定是芭蕾,這時將右下格中的得益值2下劃線。

如果小莉選足球,大海的相對佔優策略是足球,這時在大海的得益矩陣左上格中得益值2下劃線。

如果小莉選芭蕾,大海的相對佔優策略也是芭蕾,因而在右下格其得益值1 下劃線。

當雙方的相對佔優策略確定後,哪個格子裡面兩個數字都被劃線,那麼這 個格中所對應的策略組合就是一個納什均衡。

(二)箭頭法

納什均衡是一種“僵局”,給定別人不改變策略的情況下,沒有人有動力改變。納什均衡的基本思路是對博弈中的每個策略組合進行分析,考察在每個策略組合處各個博弈方能否透過單獨改變自己的策略而增加得益,如果能,則從所分析的策略組合對應的得益陣列引一箭頭,到改變策略後策略組合對應的得益陣列,最後綜合對每個策略組合的分析情況,只有箭頭指向、無箭頭指離的策略組合就是該博弈的納什均衡。

分析下例:博弈G如下圖所示:

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

納什均衡為(上,中)。

四、納什均衡的缺點

(一)在某些博弈中,納什均衡可能不存在

可以思考如果沒有納什均衡存在,又應該如何分析呢?

分析下例:監督博弈

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

給定工人偷懶,老闆的最優選擇是監督;給定老闆監督,工人的最優選擇是不偷懶;給定工人不偷懶,老闆的最優選擇是不監督;給定老闆不監督,工人的最優選擇是偷懶;如此形成迴圈。

(二)在某些博弈中,納什均衡不唯一

可以思考在納什均衡不唯一的情況下,哪一個才是最可能出現的呢?

在鬥雞博弈中,

股民修養 共1028講 博弈論 第十九講納什均衡及其求解方法

這裡存在兩個納什均衡:A進,B退;A退,B進。