博弈論中納什均衡中硬幣正反問題？

1樓：Coffee White

因為要找互為最優解。

如果不能使得雙方收益相同，那麼有一方一定會想辦法去獲得最高收益。互為最優解就是雙方的利益最均衡的情況，也就達到了穩態，具有穩定性。

2樓：垃圾

我覺得解決題主您的問題，最好的辦法就是找一本好一點的博弈論教材。

不好的書或者材料的乙個特點就是把一些很值得展開分析的東西一句話帶過。

3樓：

分享一下博弈論的出處故事

奧斯卡摩根斯特恩（Oskar Morgenstern) 在普林斯頓的seminar上講了這樣乙個問題

福爾摩斯想從倫敦去巴黎

他有兩種出行方式A和B (好像是直接從倫敦坐船出發或者先火車轉去乙個小鎮再出發)

莫里亞蒂教授想乾掉他

於是準備了一顆炸彈

眾所周知，這2個人都絕頂聰明

福爾摩斯是這樣想的

如果我選A (lv 0)

莫里亞蒂猜到我選A (=lv 0)，把炸彈放船上，我就死了 (lv 1)

所以我應該選B (lv 2)

如果莫里亞蒂猜到我會這樣想 (=lv 2)，把炸彈放火車上，我就死了 (lv 3)

所以我應該選A (lv 4)

如果莫里亞蒂猜到我會這樣想 (= lv 4)，把炸彈放船上，我就死了 (lv 5)

所以我應該選B (lv 6)

然後無限迴圈 (我喜歡把以上思考方式稱作八奇思維)

講完以後，摩根斯特恩「所以我們看到這樣乙個問題沒有解決辦法」

完，底下，坐了馮諾依曼。

眾所又周知，馮諾依曼出了名的喜歡用智商拆人場子，就說

"有啊，福爾摩斯拋個硬幣就好了，聽天由命"

4樓：blacksheep

這個等式想要的是雙方收益對等的情況下求得最優的出正反的概率，不用理解太多，無非就是想求個概率，在這概率下再求得最終期望收益而已。

5樓：甘坦

從直覺上補充一下

由於這個博弈中，對你的每乙個純策略對方都有乙個針對的（利益最大化的）純策略，而且這個針對性的策略起到了乙個「躲避」你的攻擊，讓你的「攻擊」落空的作用…

那麼你怎麼能讓對方乖乖挨打不「躲避」呢……你只能讓你的兩個「攻擊方式」獲得的效用一樣了，這樣對方也沒啥好躲的……

另外，據說這種直觀上的奇異之處，也讓混合策略在早期被一些經濟學家質疑。直到後來海薩尼提出了所有混合策略某種意義上都可以看作乙個純策略的貝葉斯均衡的退化情況。

博弈論中的「payoff」為何被翻譯為「支付」？

蛋堡學長其實現在沒有乙個被大家廣泛認可的翻譯，除了支付用的比較多以外，還有的翻譯成報酬或者收益主要的問題就是payoff可正可負，但是在漢語語境下支付一般是負的，而報酬一般是正的，都不太合適，個人認為翻譯成收益更好一點。 payoff function的實際構造應該比一般人想的複雜...

如何用博弈論來分析考研中的以下問題？

太陽能手電筒關於考研和就業，先根據自己的專業規劃一下，是本科直接就業有發展還是研究生畢業後發展潛力更大或者薪水更高。是本科學歷更好找到合適的工作還是研究生學歷更好找到。如果綜合分析後發現研究生學歷更適合個人未來職業發展，那麼就選擇考研。關於專碩和學碩，要分析一下自己更適合搞學術研究甚至有讀博的打算...

博弈論在具體的遊戲設計中的應用方面有哪些？

ian 在遊戲設計方面我想影響最大應該是平衡性設計了吧，我能想到的最明顯的一點應該就是對於絕對優勢策略的避免。簡單來說，如果爐石有兩張卡，一張477，一張566，大家都沒有能力。那對於566來說，477肯定是絕對優勢策略了，566肯定沒人帶了。又比如SC2，如果大家操作差不多，速狗rush對方一定防...

博弈論中納什均衡中硬幣正反問題？

博弈論中的「payoff」為何被翻譯為「支付」？

如何用博弈論來分析考研中的以下問題？

博弈論在具體的遊戲設計中的應用方面有哪些？

其他用戶還看了：