什麼是納什均衡,他的原理是什麼,什麼是納什均衡理論?

2021-05-23 21:01:11 字數 5402 閱讀 9908

1樓:巡夢

納什均衡,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。

納什均衡是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。

假設有n個局中人蔘與博弈,如果某情況下無一參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的),則此策略組合被稱為納什均衡。所有局中人策略構成一個策略組合。納什均衡,從實質上說,是一種非合作博弈狀態。

納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了一個整體的最優狀態,需要注意的是,只有最優策略才可以達成納什均衡,嚴格劣勢策略不可能成為最佳對策,而弱優勢和弱劣勢策略是有可能達成納什均衡的。在一個博弈中可能有一個以上的納什均衡,而囚徒困境中有且只有一個納什均衡。

2樓:匿名使用者

假設有一個團體裡面有兩個人叫a、b共同作生意

根據以前的觀點a的利益最大化、b的利益最大化那麼這個團體的利益就最大化了

但根據博弈論的觀點a的利益最大化、b的利益最大化並非會導致這個團體的利益最大化

最有名的例子就是小偷的例子

兩個小偷去偷東西被抓住了分開來審訊

這時每個小偷有2種結果,招和不招

如果招了被確認有罪責判5年,如果不招被判有罪責判10年,但如果2個人都不招則無法判其有罪責被當場釋放,這時就可以列出博弈矩陣

a招 a不招

b招 均5年 a10年,b5年

b不招 a5年,b10年 均釋放

顯然最好的策略是雙方都抵賴,結果是大家都無罪。但是由於兩人處於隔離的情況下無法串供,按照亞當·斯密的理論,每一個人都是一個「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣一個盤算過程:

假如他招了,我不招,得坐10年監獄,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他會坐10年牢,也是招了划算。綜合以上幾種情況考慮,不管他招不招,對我而言都是招了划算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了招,結果都被判5年刑期。

原本對雙方都有利的策略(抵賴)和結局 (被釋放)就不會出現。這就是著名的「囚徒困境」。它實際上反映了一個很深刻的問題,這就是個人理性與集體理性的矛盾。

3樓:匿名使用者

什麼是納什均衡理論?

4樓:雪妖

納什均衡又稱非合作博弈均衡,是博弈論中的一個重要術語,以約翰·納什的名字命名。在博弈過程中,無論對方的戰略選擇是什麼,一方都會選擇一定的戰略,這就叫主導戰略。如果兩個博弈者的戰略組合構成各自的主導戰略,則該組合被定義為納什均衡。

當每個球員的平衡策略是達到其預期收益的最大值時,一個策略組合被稱為納什均衡,同時,所有其他球員遵循這一策略。

擴充套件資料;

納什均衡可分為兩類:純戰略納什均衡和混合戰略納什均衡。

要解釋純策略納什均衡和混合策略納什均衡,首先要解釋純策略和混合策略。

所謂純策略,就是為玩家提供一個完整的遊戲定義。特別是,純粹的策略決定了在任何情況下都要進行的運動,策略集合是玩家可以執行的純策略集合。

混合策略是通過給每一個純策略分配一個概率而形成的策略,混合策略允許玩家隨機選擇純策略,在混合策略博弈的均衡中,由於每個策略都是隨機的,當達到一定的概率時,就可以得到最優支付。由於概率是連續的,即使策略集是有限的,也會有無限的混合策略。

當然,嚴格地說,每個純策略都是一個「退化」混合策略,一個特定純策略的概率為1,另一個為0。

因此,「純戰略納什均衡」是指所有參與者都玩純戰略,而相應的「混合戰略納什均衡」則是指至少有一個參與者玩混合戰略。並不是每一個博弈都會有純戰略納什均衡,比如「硬幣問題」只有混合戰略納什均衡,而不是純戰略納什均衡。

然而,仍有許多博弈具有純戰略納什均衡(如協調博弈、囚徒困境博弈和鹿博弈)。甚至,有些遊戲可以同時擁有純策略和混合策略平衡。

5樓:free情到深處腿

納什均衡理論又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略。

則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

一個策略組合被稱為納什平衡,當每個博弈者的平衡策略都是為了達到自己期望收益的最大值,與此同時,其他所有博弈者也遵循這樣的策略。

擴充套件資料

納什均衡理論創始人約翰·納什介紹——2023年6月13日—2023年5月23日,提出納什均衡的概念和均衡存在定理,是著名經濟學家、《美麗心靈》男主角原型,前麻省理工學院助教,後任普林斯頓大學數學系教授,主要研究博弈論、微分幾何學和偏微分方程。

由於他與另外兩位數學家在非合作博弈的均衡分析理論方面做出了開創性的貢獻,對博弈論和經濟學產生了重大影響,而獲得2023年諾貝爾經濟學獎。

6樓:匿名使用者

一農戶在殺雞前的晚上餵雞,不經意地說:快吃吧,這是你最後一頓!

第二日,見雞已躺倒並留遺書:爺已吃老鼠藥,你們別想吃爺了,爺也不是好惹的。

當對手知道了你的決定之後,就能做出對自己最有利的決定。

——納什均衡理論

7樓:無名之人

納什均衡是指納什平衡,納什平衡(nash equilibrium),又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名。

在一個博弈過程中,無論對方的策略選擇如何,當事人一方都會選擇某個確定的策略,則該策略被稱作支配性策略。如果兩個博弈的當事人的策略組合分別構成各自的支配性策略,那麼這個組合就被定義為納什平衡。

納什均衡理論的內容是什麼?

讓你徹底明白,什麼是納什均衡

8樓:葵姐是我

納什均衡,nash equilibrium ,又稱為非合作博弈均衡,是博弈論的一個重要術語,以約翰·納什命名,是一種策略組合,使得每個參與人的策略是對其他參與人策略的最優反應。

納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。

納什均衡可以分成兩類:"純戰略納什均衡"和"混合戰略納什均衡"。

純戰略是提供給玩家要如何進行賽局的一個完整的定義。特別地是,純戰略決定在任何一種情況下要做的移動。戰略集合是由玩家能夠施行的純戰略所組成的集合。

合戰略是對每個純戰略分配一個機率而形成的戰略。混合戰略允許玩家隨機選擇一個純戰略。混合戰略博弈均衡中要用概率計算,因為每一種策略都是隨機的,達到某一概率時,可以實現支付最優。

因為機率是連續的,所以即使戰略集合是有限的,也會有無限多個混合戰略。

9樓:匿名使用者

談到「納什均衡」,有位記者請納什用通俗的語言來解釋他的理論。納什說

;「『納什均衡』並不高深,它就像中國人發明的一種、三個人玩的撲克遊戲,「納什均衡」就是一個簡單的三人博弈遊戲」。中國有那麼多人玩撲克,又玩了那麼多年,納什還提醒了中國人半個多世紀,納什均衡並不高深,中國人竟沒有一個人發現三個人玩的撲克遊戲中、還有一個『均衡佔優理論』。人們不禁要問;納什他自己玩過幾次三人撲克遊戲?

他和誰玩的?他是怎

麼發現的均衡?均衡理論又是怎麼單方佔優的?在他所有的文章中,為什麼沒有對中國的撲克遊戲敘述。

一副撲克三個人玩,一個人18張牌,在連續記錄的0、1、2、三維繫統中,18張牌只能記錄成、18個紅藍小點而已,它是怎麼個均衡法呢?我打一個比喻,納什讓工人用磚給他鋪一個場地,他只給了18塊磚......是不是太令人費解了。

2023年,美國東部時間1月30日,cmu開發的機器程式與四名職業玩家約戰賓夕法尼亞州匹茲堡大賭場,並在持續20天的比賽時間中,每天每人1500次押注,20天一人共押30000次,四人共玩了12萬次表示均衡,才能分出輸贏。18個紅藍小點咋均衡呢?納什均衡是什麼呢?

正常人不知道,只有神經病才知道。

他在60多年的時間裡,沒有人見過他、用中國的撲克表演過什麼是、非合作納什均衡,什麼是納什均衡佔優策略,他既沒有實際表演,也沒有給出明確的理論說明,這令關注納什佔優策略的人,大為失望。

博弈聖經著作人的經典名句;科學家在納什均衡理論中、尚未發現博弈佔優策略的任何跡象。

什麼是納什均衡?能不能舉個簡單的例子

10樓:匿名使用者

納什均衡是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。

假設有n個局中人蔘與博弈,如果某情況下無一參與者可以獨自行動而增加收益(即為了自身利益的最大化,沒有任何單獨的一方願意改變其策略的[1] ),則此策略組合被稱為納什均衡。所有局中人策略構成一個策略組合(strategy profile)。納什均衡,從實質上說,是一種非合作博弈狀態。

納什均衡達成時,並不意味著博弈雙方都處於不動的狀態,在順序博弈中這個均衡是在博弈者連續的動作與反應中達成的。納什均衡也不意味著博弈雙方達到了一個整體的最優狀態,需要注意的是,只有最優策略才可以達成納什均衡,嚴格劣勢策略不可能成為最佳對策,而弱優勢和弱劣勢策略是有可能達成納什均衡的。在一個博弈中可能有一個以上的納什均衡,而囚徒困境中有且只有一個納什均衡。

案例囚徒困境

假設有兩個小偷a和b聯合犯事、私入民宅被警察抓住。**將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌 疑人,**給出的政策是:

如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8 年。

如果另一個犯罪嫌人沒有坦白而是抵賴,則以妨礙公務罪(因已有證據表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。

如果兩人都抵賴,則**因證據不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。

關於案例,顯然最好的策略是雙方都抵賴,結果是大家都只被判1年。但是由於兩人處於隔離的情況,首先應該是從心理學的角度來看,當事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當·斯密的理論,假設每個人都是「理性的經濟人」,都會從利己的目的出發進行選擇。這兩個人都會有這樣一個盤算過程:

假如他坦白,如果我抵賴,得坐10年監獄,如果我坦白最多才8年;假如他要是抵賴,如果我也抵賴,我就會被判一年,如果我坦白就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了划算。兩個人都會動這 樣的腦筋,最終,兩個人都選擇了坦白,結果都被判8年刑期。

基於經濟學中rational agent的前提假設,兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判處一年就不會出現。這樣兩人都選擇坦白的策略以及因此被判8年的結局,納什均衡」首先對亞當·斯密的「看不見的手」的原理提出挑戰:按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發,而最終全社會達到利他的效果。

但是我們可以從「納什均衡」中引出「看不見的手」原理的一個悖論:從利己目的出發,結果損人不利己,既不利己也不利他。

NBA納什外號是什麼,NBA納什資料

奈米叫他飄發哥 納黑叫他納射日或者后羿 邦納 坐地鐵去打nba的超級學霸,他 紅曼巴 的外號怎麼來的 地球表面最偉大的控球后衛 雖然只是個榮譽但是。也有說是 進攻發起者 老納,還有13爺 因為他13號 我聽說過飄發哥。呵呵 nba納什資料 nba納什,全名史蒂夫 納什。史蒂夫 納什 steve na...

「納什均衡」它會是什麼?它像UFO一樣詭異和令人百思不解

納什均衡是一種策略組合,使得同一時間內每個參與人的策略是對其他參與人策略的最優反應。假設有兩個小偷a和b聯合犯事 私入民宅被警察抓住。將兩人分別置於不同的兩個房間內進行審訊,對每一個犯罪嫌疑人,給出的政策是 如果一個犯罪嫌疑人坦白了罪行,交出了贓物,於是證據確鑿,兩人都被判有罪。如果另一個犯罪嫌疑人...

複數的原理是什么,複數的原理是什麼?

複數概念的進化是數學史中最奇特的一章,那就是數系的歷史發展完全沒有按照教科書所描述的邏輯連續性。人們沒有等待實數的邏輯基礎建立之後,才去嘗試新的征程。在數系擴張的歷史過程中,往往許多中間地帶尚未得到完全認識,而天才的直覺隨著勇敢者的步伐已經到達了遙遠的前哨陣地。1545年,此時的歐洲人尚未完全理解負...