如何從博弈論或者概率角度為 換牌喝酒 遊戲設計最佳策略?

時間 2021-05-06 18:57:52

1樓:鍵山怜奈

挖個墳,這個遊戲規則相當複雜啊……顯然「別人是否換牌」屬於決策函式的乙個引數,所以遊戲每走過乙個人局面的總可能性就要翻一倍,這問題都不知道該怎麼解了。

如果把題目條件化簡一下,遊戲中的某個玩家並沒有能力知道其他人是否換牌,也就是把局面總可能性強制限制在十四種情況之間,那麼還是可以解的。即便如此要列舉這個遊戲的最優策略還是無比困難,因為你不考慮他人的策略不代表他人的策略不會對你帶來影響,在真正計算時面對的還是無窮個不等式。只不過,當總可能性被限制了之後就可以用程式來模擬這個博弈過程了。

15個隨機初始化策略,每10個策略進行10組遊戲(每人參加3萬局遊戲),計總分,名次最低5個策略淘汰,名次最高5個策略分別放出乙個分身,每個分身的每個資料有0.1以內的偏差。

前588局的平均喝酒杯數

前8350局的平均喝酒杯數

策略隨局數變化的統計

基本上,拿到A234時選擇換牌的概率都是極其大的,拿到5以上時則幾乎不選擇換牌。

正當我在思索為何平均喝酒杯數會在到達谷底後開始回公升,忽然之間我恍然大悟,這個遊戲並不是乙個零和博弈。即便我們不能看見其他玩家的選擇,環境仍然左右了我們的行動。隨著環境的逐漸惡化每個玩家都開始耍小聰明,最終形成惡性迴圈。

但是如果每個玩家並不是呆滯地只顧自己得失,而是看著彼此,根據對方的行為調整自己的策略,隨著遊戲的進行玩家們可能將會意識到在這個無限的懲罰遊戲中合作才能給彼此帶來最小的傷害,最終不再有人換牌。

2樓:舟客

乙個簡單的分析:

自己拿的是3,要不喝酒,那剩下的有八個人拿的必須是A和2,並且不換牌,概率是:

因為拿到A和2的人肯定喝酒,他們肯定至少換一次牌,那拿到3不喝酒的概率還會更低,喝酒的概率接近於1了。。。

3樓:Mars Zhao

不要忽略了換牌的成本,換乙個比手上牌大的成本可不是半杯酒,就算是1換個2,成本也是0.5*52/51,而要換到不是最小,那要算一下別人手上牌的概率。對那1的人來說,翻身機會很渺茫,別掙扎了。

對Q來說,換到K或以上的機會也渺茫,也別換了。

最終,最好的策略都是無論手上是什麼牌,都別換,攤牌得了。

4樓:

ok 如果有人拿到最小,他必定換,如果場上沒人換了,那麼必定沒人拿到最小,那麼次小的必換,然後場上沒有了次小。那麼第三小必換。依此類推,當換牌得到點數期望小於當前時都換,大概思路是這樣。

根連鎖店悖論差不多,有興趣的可以算下。

5樓:騰天

這個遊戲被我們帝國理工一群博士給改了。

1)換牌喝一口(1/5杯),大家輪流換,可以有無限輪。

2)等到大家都滿意自己的牌的時候,開牌,最小的人喝一杯,第二的不用喝。

3)如果中途有人願意喝兩杯,可以把最小的喝變成最大的喝(稱為「反轉」)

4)最多可以反轉四次,每次懲罰杯數加一

之後這個遊戲就變得極其下酒。。。

來值乎問我問題

6樓:任雲舒

這是清華哥們的回答,藍線是換牌的平均喝酒期望,紅點是不換牌的平均喝酒期望,橫軸是抽到的點數,他說他要趕報告,沒時間跟我細說,下次面談,結果到現在還沒機會見面呢,估計要見得三月了,我也不好意思再去問,所以就來知乎問大神們了~

7樓:風孑

具體的概率還要看有多少人參加遊戲。就按十個人參加遊戲,只是說拿了三以上的有可能不用喝酒,拿了1或2肯定喝酒。當然拿到的牌越大越不容易喝酒,而且即使同樣大的牌,每乙個遊戲輸贏也不一樣。

玩這個遊戲的時候你可以通過別人的言語表情,他換牌的多少來推斷他拿到牌的大小來決定要不要換牌。當然換牌也不要超過兩次。在隨機情況下,54張牌抽到大於2/10就是拿到3可以不用換牌,但這個遊戲中每個人都可以換牌,所以3已經不是保底牌了。

當然越大越保險。是我的話,爭取拿到8點以上的牌吧。

如何從博弈論的角度理解 黑暗森林法則 ?

Dawn Lee 我們來建構乙個簡單的博弈論模型簡單分析一下,假定文明 A B 在宇宙相遇,我們無法第一時間了解對方的具體情況 進化水平,科技水平等 我們需要採取的策略為攻擊 不攻擊 如果一方發動攻擊而另一方不發動攻擊,則不發動攻擊的一方由於被毀滅得0分,而發動攻擊的一方因為消除了潛在威脅且有可能佔...

從博弈論角度而言,合作專案是否應該按每人的工作量結算報酬?

龍騰道默默地 從發問背後的心態 希望通過合理皆大歡喜 而言,這個問題其實是無解的。因為在大量非技術性的事情上,之所以乙個人可以起到30 的作用,而另乙個人能夠起到70 的作用,就是因為他們對整體大局的理解能力有高下。因此前提是,兩個人的能力和立場完全一致。而這幾乎不可能。很多時候合作中搗漿糊傾向於平...

如何用博弈論來解決寢室衛生問題?

已登出 解決不了,但還是嘗試解決一下。假設你的室友都是懶狗且無所謂寢室是否乾淨。而你又是個正常人,不想寢室髒。那麼博弈矩陣就是這樣的 室友行為 打掃不打掃 你的行為 打掃4,40,8 不打掃8,54,1 括號中前乙個數字代表你的感覺,後乙個數字代表室友的感覺,可以看出你打掃室友不打掃的時候達到了納什...