納許均衡

「納許均衡」的各地常用名稱
「納許均衡」的各地常用名稱
中國大陸	納什均衡
臺灣	納許均衡、奈許均衡
港澳	納殊均衡、拿殊均衡

定理、平衡類型
上級分類	解決方案概念
話題方面	賽局理論
得名自	約翰·富比士·納許
公式定義
理論提出者	約翰·富比士·納許

在賽局理論中，納許均衡（英語：Nash equilibrium，或稱納許均衡點）是指在包含兩個或以上參與者的非合作賽局（Non-cooperative game）中，假設每個參與者都知道其他參與者的均衡策略的情況下，沒有參與者可以透過改變自身策略使自身受益時的一個概念解。^[1]該術語以約翰·富比士·納許命名。在賽局理論中，如果每個參與者都選擇了自己的策略，並且沒有玩家可以透過改變策略而其他參與者保持不變而獲益，那麼當前的策略選擇的集合及其相應的結果構成了納許均衡。即若 $p_{i}(s)=max_{r_{i}}[p_{i}(s;r_{i})]$ ，則稱s為納許均衡點，其中： $p_{i}$ 為參與者i的收穫（payoff）， $s_{i}$ 代表所有參與者之策略， $r_{i}$ 代表參與者i的一種可能策略， $(s;r_{i})$ 指參與者i單方面改變策略為 $r_{i}$ 。^[2]

發展歷史

納許平衡的命名來由為美國數學家約翰·富比士·納許。該概念的其中一個版本已知最早於1838年被安托萬·奧古斯丁·庫爾諾運用於他的寡占理論中。在庫爾諾的理論中，商行們需選擇合適的產量以獲得最大利潤，然而一家商行的理想產量取決於其他商行的產量。當每一家商行的理想產量都需要根據已知其他商行的產量來做出調整，以達到最大利潤時，一種純策略的納許平衡——庫爾諾平衡（英語：Cournot equilibrium）就形成了。在分析平衡穩定性的過程中，庫爾諾還提出了最適反應（英語：Best response）動態（或最佳反應（英語：Best response）動態）的概念。然而納許對平衡的定義比庫爾諾的更為廣泛，也比帕勒托效率平衡的定義更為廣泛，因為納許的定義沒有針對「形成哪種平衡最為理想」作出評判。

與此相反，現代賽局理論中的納許平衡概念是用混合策略來定義的，其中的參與者傾向於符合機率分布，而非動作合理性。約翰·馮·諾伊曼和摩根斯頓在1944年出版的《賽局理論與經濟行為（英語：Theory of Games and Economic Behavior）》（英語：Theory of Games and Economic Behavior）一書中提出混合策略納許平衡的概念，然而他們的分析侷限於零和賽局這一特例。書中表明對於任何零和賽局，只要動作集合有限，就存在混合策略納許平衡。納許在1951年發表了文章《非合作賽局》（英語：Non-Cooperative Games），意在定義上述這種混合策略納許平衡，並證明這樣一場賽局至少存在一個（混合策略）納許平衡。之所以納許對上述存在性的證明能夠比馮·諾伊曼的更具普遍性，關鍵在於他對平衡所下的定義。根據納許的說法，「平衡點是當其餘參與者的策略保持不變時，能夠令參與者的混合策略極大化其收益的一個n元組」。在1950年發表的一篇論文中，僅憑著將問題置於該框架中的做法，納許就成功運用了角谷不動點定理；在1951年發表的改版論文中，納許運用了布勞威爾不動點定理。上述兩者共同證明了，存在至少一種混合策略的策略組合（英語：strategy profile），能夠針對有限參與者賽局（不一定是零和賽局）的情況自我映射，即一種不需要為提高收益而變更策略的策略組合。^[3]

自納許平衡概念形成以來，已經有賽局理論家發現，在某些情況下該概念所做的預測頗具誤導性（或缺乏唯一性）。這些理論家提出了許多相關的解概念（英語：Solution concept）（也稱為納許平衡的「微調」），意在彌補納許平衡概念中已知的瑕疵。其中一個尤為重要的問題是，某些納許平衡所依據的並非「實質性」威脅。1965年賴因哈德·澤爾騰提出子賽局完全平衡（英語：Subgame perfect equilibrium），以排除基於非實質性威脅的平衡。納許平衡的其他延伸概念闡述了重複賽局產生的影響，或資訊不完整對賽局的影響。然而，後人的微調與延伸都用到了一個關鍵性理解，也是納許概念的存在基礎：一切平衡概念都是在分析在每個參與者都考慮其他參與者的決定的情況下，最終選擇是什麼。

例子

其經典的例子就是囚犯困境。囚犯困境是一個非零和賽局。大意是：一個案子的兩個嫌疑犯被分開審訊，警官分別告訴兩個囚犯，如果你招供，而對方不招供，則你將被立即釋放，而對方將被判刑10年；如果兩人均招供，將均被判刑2年。如果兩人均不招供，將最有利，只被判刑半年。於是兩人同時陷入招供還是不招供的兩難處境。但兩人無法溝通，於是從各自的利益角度出發，都依據各自的理性而選擇了招供，這種情況就稱為納許均衡點。這時個體的理性利益選擇是與整體的理性利益選擇不一致的。

囚犯的賽局矩陣		囚犯乙
囚犯的賽局矩陣		招供	不招供
囚犯甲	招供	各判刑2年	甲立即釋放，乙判刑10年
囚犯甲	不招供	甲判刑10年，乙立即釋放	各判刑半年

基於經濟學中「理性經濟人」的前提假設，兩個囚犯符合自己利益的選擇是坦白招供，原本對雙方都有利的策略不招供從而均被判刑半年就不會出現。事實上，這樣兩人都選擇坦白的策略以及因此被判兩年的結局被稱作是「納許均衡」（也叫非合作均衡），換言之，在此情況下，無一參與者可以「獨自行動」（即單方面改變決定）而增加收穫。

學術爭議和批評

第一，納許的關於非合作賽局理論的平衡不動點解（equilibrium/fixpoint）學術證明是非建設性的（non-constructive），就是說納許用角谷不動點定理證明了平衡不動點解是存在的，但卻不能指出以什麼建設性的算法如何去達到這個平衡不動點解。這種非建設性的發現對現實生活裡的賽局的作用是有限的，即使知道平衡不動點解存在，在很多情況下卻找不到，因此仍不能解決問題。^{[來源請求]}

第二，納許的非合作賽局理論模型僅僅是突破了賽局理論中的一個局限。一個更大的局限是，賽局理論面對的往往是由幾十億節點的龐大對象構成的社會、經濟等複雜行為，但馮·諾伊曼和納許的研究是針對兩三個節點的小規模賽局理論（有人稱之為tiny-scale toy case）。^{[來源請求]}

這個假設的不完善處，可能比假設大家都是合作的更嚴重。因為在經濟學中，一個龐大社會裡的人極不可能全部都是合作的，非合作的情況通常在龐大對象的情形中更普遍，而在兩三個節點的小規模經濟中倒反而影響較小。既然改了合作前提為非合作前提，卻仍然停留在兩三個節點的小規模賽局理論中，這是一個不可忽視的缺陷。MIT的一位計算機科學博士生的博士論文^[4]——獲得2008年度美國計算機協會學位論文獎——認為經濟學家的推測是錯誤的，找到納許均衡點是幾乎不可能的事。目前擔任MIT電機工程和計算機科學系助理教授的Constantinos Daskalakis與 UC伯克利的Christos Papadimitriou、英國利物浦大學的Paul Goldberg合作，證明對某些賽局來說，窮全世界所有計算機之力，在整個宇宙壽命的時間內也計算不出納許均衡點。Daskalakis相信，計算機找不到，人類也不可能找到。納許均衡屬於NP問題，Daskalakis證明它屬於NP問題的一個子集，不是通常認為的NP-完全問題，而是PPAD（英語：PPAD）-完全問題。這項研究成果被一些計算機科學家認為是十年來賽局理論領域的最大進展。

不過在同一篇論文裡，Daskalakis也指出，在參與者匿名的情況下，則僅需多項式時間即可逼近納許均衡。

參見

參考文獻

^ Osborne, Martin J. Rubinstein Ariel. A Course in Game Theory. Cambridge, MA: MIT. 12 Jul 1994: 14. ISBN 9780262150415.
^ P.287, Annals of Mathematics 1951
^ Carmona, Guilherme; Podczeck, Konrad. On the existence of pure-strategy equilibria in large games. Journal of Economic Theory. 2009-05, 144 (3): 1300–1319. ISSN 0022-0531. doi:10.1016/j.jet.2008.11.009.
^ Constantinos Daskalakis, The Complexity of Nash Equilibria (PDF). [2009-11-10]. （原始內容存檔 (PDF)於2021-02-24）.

參考書目

Non-Cooperative Games, 約翰·納許, The Annals of Mathematics 1951

外部連結

納許賽局理論的原理與應用（頁面存檔備份，存於網際網路檔案館）北京晚報 (2002年3月21日)

[Osborne-1] Osborne, Martin J. Rubinstein Ariel. A Course in Game Theory. Cambridge, MA: MIT. 12 Jul 1994: 14. ISBN 9780262150415.

[2] P.287, Annals of Mathematics 1951

[3] Carmona, Guilherme; Podczeck, Konrad. On the existence of pure-strategy equilibria in large games. Journal of Economic Theory. 2009-05, 144 (3): 1300–1319. ISSN 0022-0531. doi:10.1016/j.jet.2008.11.009.

[4] Constantinos Daskalakis, The Complexity of Nash Equilibria (PDF). [2009-11-10]. （原始內容存檔 (PDF)於2021-02-24）.

[1]

[2]

[3]

[4]

閱論編賽局理論專題
定義	正則形式的賽局 · 擴展形式的賽局 · 圖賽局理論 · 合作賽局 · 資訊集合 · 偏好
均衡概念（英語：Solution concept）	納許均衡 · 強納許均衡（英語：Strong Nash equilibrium） · 子賽局均衡（英語：Subgame perfect equilibrium） · 貝氏納許均衡 · 貝氏完美均衡（英語：Perfect Bayesian equilibrium） · 顫抖手完美均衡 · 恰當均衡（英語：Proper equilibrium） · ε-均衡 · 相關均衡 · 序貫均衡 · 准完美均衡（英語：Quasi-perfect equilibrium） · 進化穩定策略（英語：Evolutionarily stable strategy） · 風險占優（英語：Risk dominance） · 帕雷托最適 · 自我應驗均衡（英語：Self-confirming equilibrium） · 馬爾可夫完美均衡（英語：Markov perfect equilibrium） · 默滕斯穩定均衡（英語：Mertens-stable equilibrium） · 核（英語：Core (game theory)） · 夏普利值（英語：Shapley value） · 吉布斯均衡（英語：Potentialg ame） · 量子響應均衡（英語：Quantal response equilibrium） · 謝林點
策略	優勢策略 · 純策略 · 混合策略 · 以牙還牙 · 冷酷觸發策略（英語：Grim trigger） · 策略複製論證（英語：Strategy-stealing argument） · 逆向歸納法（英語：Backward induction） · 前向歸納法（英語：Forward induction） · 馬爾可夫策略（英語：Markov strategy）
賽局類型	對稱賽局 · 完美資訊 · 序列賽局 · 重複賽局 · 傳訊賽局 · 廉價磋商（英語：Cheap talk） · 零和賽局 · 機制設計 · 隨機賽局 · 非傳遞賽局 · 全局賽局（英語：Global game） · 甄別賽局（英語：screening game） · 討價還價問題（英語：Bargaining problem） · 多人賽局（英語：n-player game） · 大型泊松賽局（英語：Large Poisson game） · 嚴格決定賽局 · 潛賽局（英語：Potential game） · 位勢賽局
賽局模型	圍棋 · 西洋棋 · 無限棋（英語：Infinite chess） · 西洋跳棋 · 井字棋 · 囚犯困境（可選擇的囚徒賽局（英語：Optional prisoner's dilemma） · 用餐者困境） · 旅行者困境 · 猜均值的2/3 · 協調賽局（英語：Coordination game） · 蜈蚣賽局 · 志願者困境 · 搭便車問題 · 拍賣美元 · 膽小鬼賽局 · 智豬賽局 · 性別戰 · 獵鹿賽局 · 賭便士（英語：Matching pennies） · 最後通牒賽局（海盜賽局） · 剪刀、石頭、布 · 獨裁者賽局（信任遊戲） · 公共財賽局（英語：Public goods game） · 納許討價還價問題（英語：Nash Bargaining Game） · 上校賽局 · 消耗戰 · 少數派賽局（El Farol酒吧問題） · 公平分配賽局（切蛋糕問題（英語：Fair cake-cutting）） · 庫諾競爭 · 死結 · 庫恩撲克遊戲（英語：Kuhn poker） · 甄別賽局（英語：Screening Game） · 公主與怪獸遊戲（英語：Princess and monster game） · 約會問題（英語：Rendezvous problem） · 囚徒帽子謎題（英語：Prisoners and hats puzzle）
定理	極值定理 · 純化定理（英語：Purification theorem） · 無名氏定理 · 顯示定理（英語：Revelation principle） · 阿羅不可能定理 · 極小化極大算法 · 納許均衡 · 策梅洛定理
關鍵人物（英語：List of game theorists）	阿爾伯特·W·塔克 · 阿摩司·特沃斯基 · 阿里埃勒·魯賓斯坦 · 克勞德·香農 · 丹尼爾·卡內曼 · 戴維·K·萊文（英語：David K. Levine） · 戴維·M·克雷普斯（英語：David M. Kreps） · 唐納德·B·吉利斯（英語：Donald B. Gillies） · 朱·弗登博格（英語：Drew Fudenberg） · 埃里克·馬斯金 · 哈羅德·W·庫恩（英語：Harold W. Kuhn） · 赫伯特·亞歷山大·西蒙（司馬賀） · 埃爾維·穆蘭（英語：Hervé Moulin） · 讓·梯若爾 · 讓-弗朗索瓦·默滕斯（英語：Jean-François Mertens） · 珍妮弗·圖爾·蔡司（英語：Jennifer Tour Chayes） · 夏仙義·亞諾什·卡羅伊 · 約翰·梅納德·史密斯 · 安托萬·奧古斯丁·庫爾諾 · 約翰·富比士·納許 · 約翰·馮·諾伊曼 · 肯尼斯·阿羅 · 肯尼思·賓默爾 · 里奧尼德·赫維克茲 · 勞埃德·沙普利 · 梅爾文·德雷希爾（英語：Melvin Dresher） · 梅里爾·M·弗勒德 · 奧嘉·邦達雷娃（英語：Olga Bondareva） · 奧斯卡·莫根施特恩（英語：Oskar Morgenstern） · 保羅·米爾格龍 · 佩頓·楊（英語：Peyton Young） · 賴因哈德·澤爾騰 · 羅伯特·阿克塞爾羅 · 羅伯特·約翰·奧曼 · 羅伯特·B·威爾遜 · 羅傑·梅爾森 · 塞繆爾·鮑爾斯（英語：Samuel Bowles (economist)） · 蘇珊娜·斯科奇姆 · 托馬斯·克羅姆比·謝林 · 威廉·維克里
參見	全支付拍賣 · Alpha-beta剪枝 · 柏氏悖論（英語：Bertrand paradox (economics)） · 有限理性 · 組合賽局理論 · 對抗分析（英語：Confrontation analysis） · 合作性競爭 · 棋局中的先手優勢（英語：First-move advantage in chess） · 賽局機制（英語：Game mechanics） · 賽局理論詞彙表（英語：Glossary of game theory） · 賽局理論家列表（英語：List of game theorists） · 特殊賽局列表 · 雙輸 · 西洋棋的解局策略（英語：Solving chess） · 拓撲賽局（英語：Topological game） · 公地悲劇 · 小決定暴政

閱論編平衡專題
概念	不動點平衡點動態平衡穩態細緻平衡暫態穩定性理論判據李雅普諾夫穩定性有界輸入-有界輸出線性穩定（英語：Linear stability）吸引子隱藏吸引子輸入-狀態穩定性準穩態臨界穩定臨界點傾覆點拐點穩定半徑（英語：Stability radius）多穩態雙穩臨界轉換（英語：Critical transition）演化穩定狀態（英語：Evolutionarily stable state）穩定措施（維基數據所列：Q44103811）自穩定（英語：Self-stabilization）防護因素（英語：Protective factor）負反饋可控制性可預測性（英語：Predictability）結構穩定性（英語：Structural stability）結構‎ 自發秩序湧現韌性不穩定性去穩定化自由度自由度 (工程學)
自然、工程與社會系統	力學平衡靜力平衡流體靜力平衡動力學平衡（英語：Dynamic balance）轉動平衡平衡力（英語：Equilibrant force）熱力學平衡熱平衡熱化（英語：Thermalisation）相平衡汽液平衡分配平衡（英語：Partition equilibrium）可逆過程非平衡定態（德語：Stationärer Prozess）耗散系統化學平衡溶解平衡電離平衡化學穩定性勒沙特列原理熱穩定性化學穩態（英語：Steady state (chemistry)）質量作用定律催化可逆反應動態平衡地殼均衡輻射平衡穩態 (電子學) 亞穩定性（英語：Metastability (electronics)）體內穩態能量穩態體液平衡（英語：Fluid balance）化學穩態（維基數據所列：Q14905559）血糖水準酸鹼平衡酸度係數滲透調節基因表達調控體溫調節人體溫度調節（英語：Human thermoregulation）血壓調節（維基數據所列：Q14819786）腎素-血管緊張素系統平衡能力平衡覺間斷平衡生態平衡 Alternative stable state（英語：Alternative stable state）生態穩定性抵抗力恢復力遺傳平衡（英語：Genetic equilibrium）競爭均衡（英語：Competitive equilibrium）社會均衡（英語：Social equilibrium）工作與生活的平衡反思平衡（英語：Reflective equilibrium）權力平衡 Balancing (international relations)（英語：Balancing (international relations)）恐怖平衡政治穩定（英語：Political stability）穩定-不穩定悖論‎
經濟與賽局理論均衡（德語：Gleichgewicht (Spieltheorie)）	納許均衡強納許均衡（英語：Strong Nash equilibrium）子賽局均衡（英語：Subgame perfect equilibrium）馬爾可夫完美均衡（英語：Markov perfect equilibrium）顫抖手完美均衡恰當均衡（英語：Proper equilibrium） ε-均衡序貫均衡准完美均衡（英語：Quasi-perfect equilibrium）風險占優（英語：Risk dominance）自我應驗均衡（英語：Self-confirming equilibrium）默滕斯穩定均衡（英語：Mertens-stable equilibrium）貝氏納許均衡貝氏完美均衡（英語：Perfect Bayesian equilibrium）相關均衡進化穩定策略競爭均衡（英語：Competitive equilibrium）帕雷托效率量子響應均衡（英語：Quantal response equilibrium）局部均衡一般均衡理論經濟穩定（英語：Economic stability）物價穩定金融穩定其它相關概念核（英語：Core (game theory)）夏普利值（英語：Shapley value）位勢賽局