金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

不亦善乎怎麼回答

今天我們來講一講博弈論,“雙贏就是中國贏兩次”這句話經過金燦榮教授的講述,廣而告之,最早的出處在哪裡?現在已經不重要了,我們沒必要用《說文解字》的那一套方法來繼續糾結這一類的小問題。考據學是一種治學方法,對於材料的必要考據,有助於加深對理論知識的理解,但是,不要為了考據而考據,不要做無聊的考據,不要像孔乙己一樣學“茴香豆的茴到底有幾種寫法”這麼low的學問。

我們要了解博弈論的歷史,瞭解博弈論的歷史,就是用考據學的治學方法來理解博弈論以及雙贏的概念。

第一:博弈論

什麼是博弈?具有競爭或對抗性質的行為稱之為博弈行為。象棋、圍棋、賭博、遊戲等等都是博弈,在英語裡稱之為“game”。

金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

賭博

博弈論,就是對策論,簡單來說就是:研究在遊戲中獲勝策略的理論。

博弈論實際上有兩個重要的概念,一個是零和博弈,還有一個是非零和博弈,我們通常所說的雙贏,其實就是非零和博弈。

關於零和博弈和非零和博弈的概念,我們也用最簡單的語言來解析一下:

金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

博弈論的最早研究者恩斯特·策梅洛

零和博弈,是指非合作博弈,博弈雙方的利益之和為零,一方有所得,另一方必有所失。最典型的零和博弈就是賭博,兩個人玩賭博,就是一方要贏錢,另一方要輸錢的,所以,我們處理事情,不能有賭徒心理。

象棋不是零和博弈,因為無論是中國象棋,還是國際象棋都存在和局的情況,和局其實就是指非零和博弈。當然,和局的前提,必須要建立規則,雙方在遵守規則的情況下,才可能有和局,如果都不遵守規則,則不可能出現和局。

玩吃雞遊戲,則不可能出現和局,打到最後,必有一個隊會吃雞,勝利只屬於吃雞的那個隊,因此,絕大多數的電子遊戲,不存在零和博弈的可能。(青少年不能沉迷於電子遊戲)

從某種程度上來說,象棋中的和棋就是非零和博弈,自己的幸福不一定是建立在他人的痛苦之上。但是,和局並沒有讓雙方都得到好處,因此,嚴格來講,非零和博弈,就是指自己所得到的利益,與另一方所失去的利益,大小不一定相等。非零和博弈在人類的經濟活動中是非常常見的,非零和博弈其實就是雙贏。

第二:囚徒困境

為了更好地理解非零和博弈,我們用“囚徒困境”這個實驗來說明,1950年,就職於蘭德公司的梅里爾·弗勒德和梅爾文·德雷希爾做了這個經典實驗。

警察逮捕了甲、乙兩名嫌疑犯,但是呢,沒有足夠的證據指控他們有罪,於是,就把甲和乙分別關進了兩個牢房,讓兩個人無法串供,然後,警察分別和這兩個人會面,並給他們三個選擇:

金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

囚徒

第一,如果甲乙雙方,有一人認罪,並提供證據指控對方,並且在對方保持沉默的情況下,那麼,認罪的一方,立即釋放,而沉默的一方,將被判10年有期徒刑。

第二,如果甲乙雙方都保持沉默,什麼話都不說,那麼,雙方被都會被判半年有期徒刑。

第三,如果甲乙雙方都互相檢舉,指控對方有罪,那麼,雙方都會被判5年有期徒刑。

列位,如果是甲乙雙方中的一員,大家該如何選擇?

實際上,每個人在經過理性的考慮之後,都會選擇檢舉對方,然後,要麼立即釋放,要麼被判5年有期徒刑。為什麼沒有人選擇第二種方案呢?第二種方案其實是最好的,互相都保持沉默,這樣雙方的利益都最大化了。但是呢,每個人在經過理性的考慮之後,往往是不願意沉默的,因為你一旦沉默,就意味著另外一方可能檢舉你,他立即釋放了,而你就會被判10年有期徒刑,但是,如果你不沉默,選擇檢舉對方,就意味著第一種方案(最優)和第三種方案(居中)就會出現,即:你要麼是立即釋放,要麼就是被判5年有期徒刑,但是,絕不會被判10年。在雙方都追求各自的利益最大化時,都互相檢舉了,然後,他們都被判了5年有期徒刑。

雙方都各自追求利益最大化,然後,都被判了5年有期徒刑的結果在經濟學領域也被稱之為納什均衡。

如果甲乙雙方選擇合作,都保持沉默,那麼,雙方被都只會被判半年有期徒刑,這種結果,符合雙方的整體利益,達到了雙方整體利益的最大化,這在經濟學領域被稱之為帕累托最優。

囚徒困境的實驗,證明了納什均衡與帕累托最優,是衝突的,當每一個人都追求自身的利益最大化時,整體的利益不一定是最大化的。

金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

義大利經濟學家帕累託

在司法活動中,警察當然是極力避免雙方串供(合作)的,但是,在實際的經濟活動中,人們是可以互相合作並達到帕累托最優的,這就是合作的意義,也是雙贏的真實含義。囚徒困境引起的雙方都互相檢舉的行為,也可以稱之為“雙輸”,即參與博弈的雙方都互有損失。

第三:合作的意義

在市場經濟體制下,市場是最佳化資源配置的決定性力量,市場交換的結果一定是帕累托最優的,也就是非零和博弈,即博弈雙方存在合作的可能性,雙方得益之和是一個不確定的變數,而不是零。

為了理解帕累托最優,我們也來舉一個例子來說明:

社會上同時存在一個百萬富翁和一個將要餓死的乞丐,並且這個乞丐沒有任何的資源和服務,可以提供給這個富翁,富翁要不要給一塊麵包給這個乞丐呢?顯然,是不需要的,因為富翁給了這個乞丐一個麵包之後,他沒有任何的資源和服務返還給富翁,富翁幹嘛要施捨一塊麵包,把錢無償轉移到乞丐的身上呢?不給乞丐一塊麵包,就是帕累托最優,即非零和博弈。

但是呢,這個乞丐因為得到這塊麵包之後,而活命了,乞丐的福利和幸福感就極大地提高了,那麼,富翁就應該施捨一塊麵包給這個乞丐,從這個意義上來講,這也是帕累托最優和非零和博弈。

非零和博弈、帕累托最優,在中國古代歷史上,最經典的案例,就是宋太祖的杯酒釋兵權。

北宋建隆三年(公元962年)七月初九日,趙匡胤在退朝之後,單獨留下石守信、高懷德、王審琦等高階將領宴飲,酒至半酣,太祖說:“我非爾曹不及此。然吾為天子,殊不若為節度使之樂。吾終夕未嘗安枕而臥。”石守信問宋太祖為何如此?太祖又說:“是不難知矣。居此位者,誰不欲為之?”石守信等人聽了這句話之後大驚失色,連忙說道:“陛下何出此言,如今天命已定,誰敢再有異心?”太祖又說道:“人孰不欲富貴,一旦有以黃袍加汝之身,雖欲不為,其可得乎?”

金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

宋太祖趙匡胤

石守信等人頓首涕泣,希望宋太祖指一條生路給他們,宋太祖說:“人生駒過隙爾,不如多積金,市田宅,以遺子孫,歌兒舞女,以終天年,君臣之間,無所猜嫌,不亦善乎?”

第二天,這些高階將領們都稱病不朝,紛紛表示要辭職,然後,宋太祖給了他們優厚的待遇,廣置田宅、歌兒舞女,頤養天年。宋太祖和石守信等高階將領之間,實現了非零和博弈、帕累托最優,即雙贏,避免了“黃袍加身”的一幕再度重演,從而徹底結束了五代以來的動盪不安。

帕累托最優的概念,最早是由義大利經濟學家、社會學家維爾弗雷多·帕累託發現的,帕累託後來還發現了帕累托法則。帕累托法則就是八二法則,因為帕累託發現了一個有趣的自然現象:80%的豌豆產量來自20%的植株,與此同時,他還發現了有趣的經濟現象:義大利約有80%的土地由20%的人口所有。

帕累托法則在很多領域都被應用了,比如,在企業管理領域,人們發現80%的銷售額來自20%的客戶。

帕累托法則的發現實際上就是證明了人類是無知的,16世紀至17世紀發生的科學革命的意義就是承認了人類的無知,正如以色列歷史學家尤瓦爾·赫拉利在《人類簡史》一書中所說中的那樣,“現代科學是一套獨特的知識體系,獨特之處也就在於公開承認這‘整套體系’都對一些‘最重要的問題’一無所知。”

經濟學是一門社會科學,社會科學也是科學,在市場經濟體制下,市場是最佳化資源配置的決定性力量,這一點我們必須要承認,充分發揮市場的作用,就是承認人類的無知、尊重客觀的科學規律,市場經濟是人類在經濟活動中自然產生的規則秩序。

但是,市場有的時候也會失靈,市場失靈從某種程度上來說並不是因為市場經濟本身自然產生的規則秩序導致的,而是受到很多人為因素的干擾而導致的,是人的非理性選擇導致的,比如:壟斷、交易成本和資訊不對稱、強買強賣等等,市場失靈就需要發揮政府的作用。

1982年,經濟學家在德國的科隆大學又做了一個著名的實驗,稱之為“最後通牒博弈(Ultimatum Game)”。古典經濟學家和新古典經濟學家,都支援自由市場經濟,反對政府過度干預經濟,反對凱恩斯主義經濟學的相關學說,並且假設每個經濟人都是理性的。但是,這個“最後通牒博弈”徹底顛覆了新古典經濟學的一些說法。

金燦榮:雙贏就是中國贏兩次?兩個囚徒關進大牢的故事,瞭解一下

英國新古典經濟學家阿爾弗雷德·馬歇爾

這個實驗有兩名參與者甲和乙,現在有100美元準備分配給甲和乙,如果兩人中的一人提出一種資源分配方案,獲得了另外一個人的同意,那麼,就按照這種方案進行資源分配,如果另外一個人沒有同意的話,那麼,兩人什麼都得不到。按照古典經濟學家和新古典經濟學家的說法,假設每一個人都是理性的經濟人,並且追求利益的最大化,那麼,甲提出的方案,一定是自己擁有99美元,然後分1美元給乙。但是,實驗的結果,顛覆了古典經濟學家的認知,甲自己得到99美元,乙得到1美元,乙就會覺得自己受到了侮辱,他乾脆就不要這1美元了,只有當甲給出足夠多的資源(30美元或40美元)給乙時,乙才會同意這個方案,因此,分配方案,是趨向於每個人都得到50美元的。

在採集部落社會中,人類學家也觀察到了相同的現象,一個男人出去打獵,獲得了一隻野鹿,他會將這隻鹿分給每一個人。靈長類動物黑猩猩也是如此,一隻黑猩猩抓到獵物,同樣也會分享給每一個夥伴。這個問題說明了動物之間的交流,是非常複雜的,而不僅僅是依靠簡單的冷冰冰的數學工具。

因此,雙贏不是一個人贏兩次,而是互惠互利。我們要承認人類的無知,“現代科學是一套獨特的知識體系,獨特之處也就在於公開承認這‘整套體系’都對一些‘最重要的問題’一無所知。”孔子說:“知之為知之,不知為不知,是知(智慧)也。”