股民修養 共1028講,第32講 納什均衡的多重性及其選擇
股民修養 共1028講 博弈論 第32講 納什均衡的多重性及其選擇
第32講 納什均衡的多重性及其選擇
納什均衡在相當廣泛的博弈型別中普遍存在,保證了這個均衡概念在博弈分析中的作用和地位。納什均衡也是分析其他型別博弈的核心均衡概念,如子博弈完美納什均衡、完美貝葉斯均衡和貝葉斯納什均衡等。這些均衡實際上都是納什均衡的某種精煉。
納什均衡分析並不一定能徹低解決一個博弈問題。因為納什均衡的存在性不等於唯一性,在許多博弈中納什均衡是不唯一的,而且不同的納什均衡相互之間也沒有明顯的優劣關係,從而使博弈方在作策略選擇時會遇到困難。
對於博弈論專家而言,最為棘手的不是一個博弈是否存在均衡,而是一個博弈可能有多個均衡,這被稱為納什均衡的多重性。我們已經看到,約會博弈有三個納什均衡,事實上,許多博弈都存在多個納什均衡,有些博弈甚至有無窮多個納什均衡。
對於一個博弈可能有多個均衡,即納什均衡的多重性問題,博弈論並沒有一個一般的理論證明某一個納什均衡結果一定能出現,但也還是可以根據不同的理念找出一定的選擇標準。
一、帕累託上策均衡
帕累託效率準則是:經濟的效率體現於配置社會資源以改善人們的境況。
主要看資源是否已經被充分利用,如果資源已經被充分利用,要想改善任何人的境況都必須損害別人的利益,那麼這個經濟已經實現了帕累託效率;相反,如果還可以在不損害別人的情況下改善一些人的境況,就說明經濟資源尚未被充分利用,就不能說這個經濟已達到帕累託效率。
帕累託改進是調整既定的資源配置狀態使得至少有一個人的狀況變好,而沒有使任何人的狀況變壞。雖然有些博弈中存在多個納什均衡,但很可能這些納什均衡有明顯的優劣差異,所有博弈方都偏好其中同一個納什均衡,則該納什均衡稱為“帕累託上策均衡”。
1、 鷹鴿博弈
假設有國家
1
和國家
2,
在發生衝突時可以採取鷹策略,即發動戰爭;也可以採取鴿策略,即和平協商解決。得益矩陣如下:
容易看出,這個博弈中有兩個純策略納什均衡,分別為(戰爭,戰爭)和(和平,和平),但其中(和平,和平)是帕累託上策均衡。
2、獵人博弈
假設有獵人甲和獵人乙,他們有兩個策略選擇:即共同去打鹿和各自去打兔,由於鹿的體量較大,需要兩人協作才能捕獲,而兔子體量較小,只需要一個 人努力就可以達到。得益矩陣如下所示:
分析過程:此博弈存在兩個納什均衡:一起打鹿得(10,10)和各自去打兔得 (4,4)O比較(1。,1。)與(4,4),很明顯,兩人一起去獵鹿的得益比各自去打兔的得益要大得多。甲、乙兩人一起獵鹿得(10,10),比兩人各自去打兔得(4,4) 的納什均衡具有帕累託優勢。因此,獵人博弈的結局,最大可能是具有帕累託優勢的那個納什均衡,甲、乙一起獵鹿得(10,10)。
注意:具有帕累託優勢的納什均衡是各博弈方都得到改善的策略組合;在博弈之前博弈方預先交流會增加帕累托最優均衡的可能性;此時風險優勢處於從屬地位。
3、行賄博弈
下面為高薪格局下行賄博弈和底薪格局下行賄博弈的得益矩陣,請分析這兩種情況下博弈方甲和博弈方乙分別會作出什麼選擇?兩種情況下最可能出現的納什均衡是什麼?
二、聚點均衡
其實多重納什均衡的困難,主要還在於不存在帕累託上策均衡。如約會博弈的三個納什均衡中,除了混合策略納什均衡明顯較差以外,兩個純策略納什均衡之間不存在帕累託效率意義上的優劣關係,一個對大海有利,另一個則對小麗有利,因此兩個博弈方究竟會怎麼選擇很難進行判斷。此類博弈問題其實是很多的,凡是涉及利益分配、合作條件等的博弈問題,都可能屬於這種情況。 聚點均衡確實反映了人們在多重納什均衡選擇中的某些規律性。
再看下例:在以下的選擇中,如果你的選擇與其他博弈方的選擇一致的次數越多,你就贏得越多,那麼,請問你在博弈中將採取什麼策略?
①選擇下述一個數並畫圈:7,100,13,261,99,666。
②你要在中南財大與一個沒有來過中南財大的高中同學會面,應在什麼公共地點碰頭?
③選擇下述一個數並畫圈:14,15,16,17,18,100。
④你與他人一起分蛋糕,你們各自報出期望分到的比例,但如果你們報的比例之和超過100% ,大家都將一無所獲。
如上述幾個例子所示,在一些博弈中,博弈參與人的行動需要協調一致才能使每個人的收益最大。按照謝林的觀點,協調博弈的解是一個聚點均衡。如果參與人協調成功,那麼參與人的收益應該在最多數人所選擇的那個均衡點上 實現,這個均衡點被稱為聚點均衡(focal point),又稱為謝林點(ScheHing point)。這一概念最早由諾貝爾獎獲得者謝林1960年在《衝突的戰略》中提出:“人們得知別人也試圖做出和自己同樣的行為時,常常能使他們的意圖或期望達成一致。大多數情況——或許每一種情況都能為此種博弈參與人的合作提供一些線索,為每個人的期望提供‘聚點’,其中每個人的期望是別人期望他期望被期望去做的事。”也就是說,聚點是在協調博弈中博弈參與人透過相互期望所作出的共同選擇的那個均衡點,它顯示出博弈中人們在沒有溝通情況下的共同選擇傾向。
那麼,哪些因素會影響聚點的形成呢?以下從幾個方面進行介紹:
1、法律和社會規範協調預期
法律和社會規範就是一種協調預期的規則,幫助人們在多個納什均衡中篩選一個特定的納什均衡。法律是立法機關制定的行為規則,社會規範是透過長期的互動博弈產生的習慣或行為規則,但不論是法律還是社會規範,它們的功能都是協調預期。
2、文化的衝突與協調
文化衝突,無論是組織和組織之間的,還是國家和國家之間的,大部分不過是遊戲規則——法律和社會規範的衝突。用博弈論的話來說,是一個均衡的選擇問題;全球化意味著遊戲規則的重新博弈。
3。解決規則衝突的三個方式
①一個規則取代其他的規則,讓一部分人改變行為規範適應另一部分人, 也就是所謂的“接軌”,如歐洲大陸交通規則的演變。
②建立全新的規則,如中國人和德國人在一起交流時都用英語,而不是中文,也不是德語;
③建立協調規則的規則,如“入鄉隨俗”“客隨主便”。
究竟選擇哪一種方式,與規則要解決的問題有關,也與其他因素有關。
分析下例:進門博弈
分析過程。在進門博弈中,有兩個聚點均衡:分別為(先進,後進)和(後進,先進)。在該博弈中,文化既解決衝突又協調預期,如尊老愛幼、女性優先、尊師重教、先來後到、公平觀念、社會分層和非對稱權力等,來協調誰先走誰先走的問題。
三、風險上策均衡
再看下例:串謀博弈
用劃線法可求得這個博弈存在兩個納什均衡:(作弊,作弊)、(不作弊,不作 弊),那麼,哪一個發生的可能性較大呢?
分析過程。先考慮甲方:
甲作弊時,甲贏得9和0的機會為一半對一半,甲的期望得益為:
u1(s1,σ2)=9×1/2 +0 ×1/2 =4。5
甲不作弊時,甲贏得8和7的機會為一半對一半,甲的期望得益為:
u1(s2,σ2)=8×1/2 +7×1/2 =7。5
結論。由於u1(s1,σ2)<u1(s2,σ2),從期望得益看,甲採取不作弊的策略較穩妥。由於這個博弈是對稱的,對乙的分析同理。那麼博弈的實際結局極有可能為(不作弊,不作弊),即(7,7)為具有風險優勢的納什均衡,風險優勢指風險較小,該納什均衡為“風險上策均衡”。
一般採用風險佔優法(期望得益比較法)是指透過比較期望得益的大小,選擇納什均衡中具有風險優勢(風險較小)的策略。
四、相關均衡
對於博弈中多重納什均衡選擇的難題,我們也應該考慮博弈方主動尋求方法, 設計某種形式的均衡選擇機制,以解決多種納什均衡選擇的情況。“相關均衡”就 是構建這樣一種均衡選擇機制,其基本思想可以透過下面的博弈模型來說明。
本博弈有(U, L)和(D, R)兩個純策略納什均衡,另外有一個混合策略納什均衡[(1/2,1/2), (1/2,1/2)],即兩博弈方都以1/2的機率在自己的兩個純策略中隨機選擇。雖然該博弈的兩個純策略納什均衡都能使兩博弈方得到6單位得益總和,但在這兩個策略納什均衡下,雙方的利益相差很大,因此很難在兩博弈方之間形成自然的妥協,聚點均衡的概念是不適用的。如果採用混合策略納什均衡,因為有1/4的可能性遇到最不理想的(U,R),因此雙方的期望得益都只有2。5單位,顯然也不理想。
由於避免出現(U, R)結果符合雙方的利益,因此雙方有可能透過協商約定採用如“拋一硬幣,出現正面就選擇納什均衡(U,L),出現反面就選擇納什均衡 (D,R)”這樣的選擇規則。按照這樣的規則選擇,那麼兩個純策略納什均衡(U,L)和(D,R)各有1/2岀現的可能,且可以保證排除採用最不理想的策略 (U,R),雙方的期望得益都是3,明顯好於雙方各自採用混合策略的期望得益,也解決了雙方在兩個純策略納什均衡選擇方面的僵局。同樣的思路用到約會博弈上,就是雙方可能形成這樣的約定:“如果天氣好一起去看足球賽,天氣不 好則一起去看時裝表演。”
另一種方法是設計能發出“相關訊號”的“相關裝置”:
①該裝置以相同的可能性(1/3)發出A、B、C三種訊號;
②博弈方I只能看到該訊號是否為A,博弈方II只能看到該訊號是否為C;
③博弈方I看到A釆用U,否則採用D,博弈方II看到C釆用R,否則採用L。
因此該裝置的訊號有三種可能性:(A,C),(A,C),(A,C);
對應的策略:(U,L),(D,R),(D,L)。
該策略機制有下列重要性質:①保證
U
和
R
不會同時出現,即排除了 (U,R) ;②(D,R)、(D,L)各以
1/3
的機率出現,從而使兩博弈方的期望得益達到
3+1/3,
優於u
1
=3,u2
=3;
③上述策略組合是一個納什均衡;④上述相關裝置並不影響雙方在各種策略組合下的得益,因此並不影響原來的均衡。即如果一個博弈方忽視訊號,另一個博弈方也可以忽視訊號,並不影響各博弈方原來可能實現的利益。我們稱博弈方根據相關裝置選擇策略構成的納什均衡為“相關均衡”。
五、共謀和防共謀均衡
多人博弈中可能存在共謀問題。
例如,這是一個三人博弈的例子,假設有這樣的賦值:
由劃線法可知,該博弈的純策略納什均衡為
:(U,L,A)
、(
D,R,B),
前者帕累託優於後者,而且在風險上策的意義上前者也優於後者。那麼博弈的結果會 是什麼呢?
如果博弈方各自獨立決策和採取行動,不考慮部分博弈方存在串通一致行動的可能性,那麼該博弈的結果應該是
(U,L,A)O
但是,如果我們考慮到博弈方之間存在串通或共謀的可能性,那麼
(U,L, A)
卻並不一定是博弈的最終結果。因為如果博弈方
HI
選擇
A,
則只要博弈方
I
和博弈方
II
達成一致行動的默契,分別採用
D
和
R,
他們就都可以獲得
1
單位得益,大於
(U,L,A)
時得到的零得益。
也就是說
,(U,L,A)
有共謀
(coalition)
問題:博弈方
I
和
II
同時可能偏離。進一步考慮靜態博弈中納什均衡分析的有效性問題時,很容易發現在多人博弈中,有可能存在部分博弈方之間聯合追求小團體利益的行為,也可能會導致納什均衡的不穩定性。對這種可能性的考慮,匯出了“防共謀均衡”的概念。
上述共謀問題引出了“防共謀均衡”的思想。如果一個博弈的某個策略組合滿足下列要求:沒有任何單個博弈方的“串通”會改變博弈的結果;給定偏離的博弈方有再次偏離的自由,沒有任何兩個博弈方的“串通”會改變博弈的結果;以此類推,直到所有博弈方都參加“串通”也不會改變博弈的結果,則稱這樣的均衡策略組合為“防共謀均衡”。因而上例中
(D,R,B)
是防共謀均衡
,(U, L, A)
不是防共謀均衡。