動態博弈論模型如何建立，博弈論模型

1樓：

請仔細檢視歷年，清華大學的，或者北京大學，人民大學博士研究生招考經濟類的專業課試題，裡邊都有這方面建立博弈模型的題目。

2樓：匿名使用者

經典的廣告博弈

兩家公司共同佔據某產品的市場，他們都有「做廣專告」和「不做廣告」兩種選擇。屬

若兩家都不做，則平分市場，雙方得益各為8；

若兩家都做，仍然平分市場，但因廣告費用而降低了利潤，此時的雙方得益各為4；

若一家做，另一家不做，做廣告的那家將獲得更高的市場份額和利潤，做的那家得益10，另一家得益2。

雙方都是追求個人利益最大化，我們可以分析，當對方選擇做廣告時，我方做廣告得益4，我方不做廣告得益2，顯然做廣告比不做廣告好；當對方選擇不做廣告時，我方做廣告得益10，不做廣告得益8，顯然還是做廣告比不做廣告好；總之，不管對方選擇廣告還是不做廣告，我方最優的選擇都是做廣告，同時對方也是這麼想的，最終雙方都會做廣告，各自得益4，而如果雙方都不做廣告，可以得益8。也就是當所有博弈參與者追求個人理性的時候，往往會導致次優的結果。

3樓：長雙公主

這個問題基本上很難!

博弈論模型 50

4樓：★懸葉

經典的囚徒困境

一般形式

現實的例子

與囚徒困境相關的各事件

重複的囚徒困境

相關的博弈

註釋囚徒困境（prison dilemma）是博弈論的非零和博弈中具代表性的例子，反映個人最佳選擇並非團體最佳選擇。雖然困境本身只屬模型性質，但現實中的**競爭、環境保護等方面，也會頻繁出現類似情況。

單次發生的囚徒困境，和多次重複的囚徒困境結果不會一樣。

在重複的囚徒困境中，博弈被反覆地進行。因而每個參與者都有機會去「懲罰」另一個參與者前一回合的不合作行為。這時，合作可能會作為均衡的結果出現。

欺騙的動機這時可能被受到懲罰的威脅所克服，從而可能導向一個較好的、合作的結果。作為反覆接近無限的數量，納什均衡趨向於帕累托最優。

囚徒困境的主旨為，囚徒們雖然彼此合作，堅不吐實，可為全體帶來最佳利益（無罪開釋），但在資訊不明的情況下，因為出賣同夥可為自己帶來利益（縮短刑期），也因為同夥把自己招出來可為他帶來利益，因此彼此出賣雖違反最佳共同利益，反而是自己最大利益所在。但實際上，執法機構不可能設立如此情境來誘使所有囚徒招供，因為囚徒們必須考慮刑期以外之因素（出賣同夥會受到報復等），而無法完全以執法者所設立之利益（刑期）作考量。

[編輯本段]經典的囚徒困境

2023年，由就職於蘭德公司的梅里爾·弗勒德（merrill flood）和梅爾文·德雷希爾（melvin dresher）擬定出相關困境的理論，後來由顧問艾伯特·塔克（albert tucker）以囚徒方式闡述，並命名為「囚徒困境」。經典的囚徒困境如下：

**逮捕甲、乙兩名嫌疑犯，但沒有足夠證據指控二人入罪。於是**分開囚禁嫌疑犯，分別和二人見面，並向雙方提供以下相同的選擇：

若一人認罪並作證檢控對方（相關術語稱「背叛」對方），而對方保持沉默，此人將即時獲釋，沉默者將判監10年。

若二人都保持沉默（相關術語稱互相「合作」），則二人同樣判監半年。

若二人都互相檢舉（互相「背叛」），則二人同樣判監2年。

用**概述如下：

甲沉默（合作）甲認罪（背叛）

乙沉默（合作）二人同服刑半年甲即時獲釋；乙服刑10年

乙認罪（背叛）甲服刑10年；乙即時獲釋二人同服刑2年

解說如同博弈論的其他例證，囚徒困境假定每個參與者（即「囚徒」）都是利己的，即都尋求最大自身利益，而不關心另一參與者的利益。參與者某一策略所得利益，如果在任何情況下都比其他策略要低的話，此策略稱為「嚴格劣勢」，理性的參與者絕不會選擇。另外，沒有任何其他力量干預個人決策，參與者可完全按照自己意願選擇策略。

囚徒到底應該選擇哪一項策略，才能將自己個人的刑期縮至最短？兩名囚徒由於隔絕監禁，並不知道對方選擇；而即使他們能交談，還是未必能夠盡信對方不會反口。就個人的理性選擇而言，檢舉背叛對方所得刑期，總比沉默要來得低。

試設想困境中兩名理性囚徒會如何作出選擇：

若對方沉默、背叛會讓我獲釋，所以會選擇背叛。

若對方背叛指控我，我也要指控對方才能得到較低的刑期，所以也是會選擇背叛。

二人面對的情況一樣，所以二人的理性思考都會得出相同的結論——選擇背叛。背叛是兩種策略之中的支配性策略。因此，這場博弈中唯一可能達到的納什均衡，就是雙方參與者都背叛對方，結果二人同樣服刑2年。

這場博弈的納什均衡，顯然不是顧及團體利益的帕累托最優解決方案。以全體利益而言，如果兩個參與者都合作保持沉默，兩人都只會被判刑半年，總體利益更高，結果也比兩人背叛對方、判刑2年的情況較佳。但根據以上假設，二人均為理性的個人，且只追求自己個人利益。

均衡狀況會是兩個囚徒都選擇背叛，結果二人判決均比合作為高，總體利益較合作為低。這就是「困境」所在。例子漂亮地證明了：

非零和博弈中，帕累托最優和納什均衡是相沖突的。

[編輯本段]一般形式

整理囚徒困境的基本博弈結構，可更清楚地分析囚徒困境。實驗經濟學常用這種博弈的一般形式分析各種論題。以下是實現一般形式的其中一例：

有兩個參與者和一個莊家。參與者每人有一式兩張卡片，各印有「合作」和「背叛」。參與者各把一張卡片文字面朝下，放在莊家面前。

文字面朝下排除了參與者知道對方選擇的可能性1。然後，莊家翻開兩個參與者卡片，根據以下規則支付利益：

一人背叛、一人合作：背叛者得5分（背叛**），合作者0分（受騙支付）。

二人都合作：各得3分（合作報酬）。

二人都背叛：各得1分（背叛懲罰）。

用支付矩陣**展示支付如下（以紅和藍分別表示二參與者）：

一般形式囚徒困境的支付矩陣合作背叛

合作 3, 3 0, 5

背叛 5, 0 1, 1

以「t、r、p、s」符號表示合作背叛

合作 r, r s, t

背叛 t, s p, p

以「勝－負」術語表示合作背叛

合作勝-勝大負-大勝

背叛大勝-大負負-負

簡單博弈獲得的點數可以得出一些一般化的結論。

t、r、p、s符號表

符號分數英文中文（非術語）解釋

t 5 temptation 背叛** 單獨背叛成功所得。

r 3 reward 合作報酬共同合作所得

p 1 punishment 背叛懲罰共同背叛所得

s 0 suckers 受騙支付被單獨背叛所獲

若以t（temptation）=背叛**，r（reward）=合作報酬，p（punishment）=背叛懲罰，s（suckers）=受騙支付，以個人選擇得分而言，可得出以下不等式。

t>r>p>s

（解：從5>3>1>0獲得以上不等式）

若以整體獲分而言，將得出以下不等式。

2r>t+s或2r>2p

（解：2×3>5+0或2×3>2x1；合作2人共得6分，比起互相背叛的共得2分及單獨背叛的共得5分，顯然合作獲分比背叛高。合作在團體而言是支配性策略。）

而重複博弈或重複的囚徒困境將會使參與者從注重t>r>p>s轉變成注重2r>t+s。就是說將使參與者脫離困境。以上理論是道格拉斯·霍夫施塔特建立的。

[編輯本段]現實的例子

上述例子可能顯得不甚自然，但現實中，無論是人類社會或大自然都可以找到類似囚徒困境的例子，將結果劃成同樣的支付矩陣。社會科學中的經濟學、政治學和社會學，以及自然科學的動物行動學、進化生物學等學科，都可以用囚徒困境分析，模擬生物面對無止境的囚徒困境博弈。囚徒困境可以廣為使用，說明這種博弈的重要性。

以下為各界例子：

政治學例子：軍備競賽

在政治學中，兩國之間的軍備競賽可以用囚徒困境來描述。兩國都可以聲稱有兩種選擇：增加軍備（背叛）、或是達成削減**協議（合作）。

兩國都無法肯定對方會遵守協議，因此兩國最終會傾向增加軍備。似乎自相矛盾的是，雖然增加軍備會是兩國的「理性」行為，但結果卻顯得「非理性」（例如會對經濟造成都有損壞等）。這可視作遏制理論的推論，就是以強大的軍事力量來遏制對方的進攻，以達到和平。

經濟學例子：關稅戰

兩個國家，在關稅上可以有以兩個選擇:

提高關稅，以保護自己的商品。（背叛）

與對方達成關稅協定，降低關稅以利各自商品流通。（合作）

當一國因某些因素不遵守關稅協定，獨自提高關稅（背叛），另一國也會作出同樣反應（亦背叛），這就引發了關稅戰，兩國的商品失去了對方的市場，對本身經濟也造成損害（共同背叛的結果）。然後二國又重新達成關稅協定。（重複博弈的結果是將發現共同合作利益最大。

）商業例子：廣告戰

商業活動中亦會出現各種囚徒困境例子。以廣告競爭為例。

兩個公司互相競爭，二公司的廣告互相影響，即一公司的廣告較被顧客接受則會奪取對方的部分收入。但若二者同時期發出質量類似的廣告，收入增加很少但成本增加。但若不提高廣告質量，生意又會被對方奪走。

此二公司可以有二選擇：

互相達成協議，減少廣告的開支。（合作）

增加廣告開支，設法提升廣告的質量，壓倒對方。（背叛）

若二公司不信任對方，無法合作，背叛成為支配性策略時，二公司將陷入廣告戰，而廣告成本的增加損害了二公司的收益，這就是陷入囚徒困境。在現實中，要二互相競爭的公司達成合作協議是較為困難的，多數都會陷入囚徒困境中。

自行車賽例子

自行車賽事的比賽策略也是一種博弈，而其結果可用囚徒困境的研究成果解釋。例如每年都舉辦的環法自由車賽中有以下情況：選手們在到終點前的路程常以大隊伍（英文:

peloton）方式前進，他們採取這策略是為了令自己不至於太落後，又出力適中。而最前方的選手在迎風時是最費力的，所以選擇在前方是最差的策略。通常會發生這樣的情況，大家起先都不願意向前（共同背叛），這使得全體速度很慢，而後通常會有二或多位選手騎到前面，然後一段時間內互相交換最前方位置，以分擔風的阻力（共同合作），使得全體的速度有所提升，而這時如果前方的其中一人試圖一直保持前方位置（背叛），其他選手以及大隊伍就會趕上（共同背叛）。

而通常的情況是，在最前面次數最多的選手（合作）通常會到最後被落後的選手趕上（背叛），因為後面的選手騎在前面選手的沖流之中，比較不費力。

動態博弈論模型如何建立，博弈論模型

博弈論有什麼用博弈論是什麼博弈論研究什麼問題有什麼作用

博弈論是什麼

博弈論中有關囚徒困境的問題關於博弈論中囚徒困境的問題

動態博弈論模型如何建立，博弈論模型

博弈論有什麼用博弈論是什麼博弈論研究什麼問題有什麼作用

博弈論是什麼

博弈論中有關囚徒困境的問題關於博弈論中囚徒困境的問題

相關推薦