經濟系

Nash 均衡

    Nash均衡(Nash equilibrium)是賽局理論中一個很重要的概念。如果某一組策略是Nash均衡,任何一個參賽者單獨改變自己的策略並不會使自己的報酬提高。也就是說,如果別人都玩Nash均衡策略時,我會發現這個均衡策略會是我的最佳的選擇(也就是最適回應,best response)。當所有人都玩這一個Nash均衡策略時,沒有人會想要悖離(deviate)。

    Nash均衡是基於某些對人的行為的假設。例如,所有參賽人皆清楚的了解對手有哪些行動,並且就所有可能的行動中選出一個最適的反應。而這些都是所有人的共同知識(common knowledge)。

    我們可以用以下的「囚犯困境」賽局來說明如何找出Nash均衡。

    甲,乙兩人因案被捕,警方分開偵訊。因為證據不夠充分,須要嫌犯的自白。因此,警方告訴兩人,「如果你認罪,但你的同夥不認罪,你只要被關一年,但你的同夥要被關五年。可是如果你不認罪,而你的同夥認罪了,你要被關五年,但你的同夥只要被關一年。如果你們倆都認罪了,你們都要被關三年。」但如果兩人都不認罪,由於證據薄弱,兩人只要被關兩年。

    明顯的,如果兩人都不認罪,對彼此都是最好的。這種情況是社會最適。但這會是均衡結果嗎?不幸的,答案是否定的。甲會這樣想:「如果乙認罪了,我最好也認罪;但如果乙不認罪,我最好還是認罪。」乙也同樣會這樣想。因此,「認罪」是兩人的優勢策略(dominant strategy)。「甲認罪,乙認罪」就變成這個賽局的Nash均衡。尤其我們也看到,Nash均衡未必是社會最適。

    麻煩的是,有時候Nash 均衡可能不只一個。這時可能需要一些規範,歷史因素,或事前的溝通,才來能確定最後出現的是哪一個均衡。而有些賽局可能沒有純粹策略(pure,亦即參賽者選的是一個確定的行動)的Nash 均衡。這時我們可能要考慮參賽者會玩混合策略(mixed strategy)時的Nash 均衡,也就是賦予純粹策略一個機率分配。

國立台灣大學