博弈論取石子兒問題?

時間 2021-06-01 05:29:45

1樓:zzyzzy

樓上說的已經不錯了我就再補充一點吧

首先這類遊戲叫做progressively bounded two-person impartial game,名字叫chomp

impartial game 就是說資訊完全公開雙方在同乙個位置有同樣的步驟選擇(例:象棋就不是impartial game),比較常見的這類遊戲是Nim,有興趣可以去了解下。Progressively bounded就是這個遊戲在有限步之內能結束,也就是你不能走回之前的某個狀態。

然後這類遊戲有乙個很重要的性質就是必定有乙個人有必勝策略(不是說他一定能贏但是他可以必勝)

然後我們定義乙個遊戲的N點和P點,N點就是在這個點上 (Next)下乙個動的人有必勝策略,P點就是(Previous)之前動的人有必勝策略

比如chomp,只剩下一顆石子的時候就是P點,因為下乙個動的人必輸

然後NP點有這樣的性質,所有N點,下一步必定能動到P點,所有P點,下一步只能到N點

換言之你若處於N點,且你動,那麼必勝策略就是移到P點去,對手只能移到N點,每次都保證你移到P點,最後就能獲勝了(假設這是Normal Game,Misere的暫時不考慮)

接下來就是看M*N去掉右上角的的情況了,假如這是乙個P點,那麼M*N就是N點,必勝策略就是拿走右上角。假如這是乙個N點,那麼根據之前的知識,那麼他能去乙個P點,這樣利用樓上說的strategy stealing,M*N是乙個N點,因為他也能到那個P點……

所以綜上所述 M*N是乙個N點,也就是有必勝策略

至於策略是什麼,可以逆推找出所有的N點和P點,然後你就可以知道了,但是據我所知沒有像Nim一樣的通解,我學藝不精,只會這些了

面試問題,博弈論的選擇?

假設拿到10,20,80,200,500的人,選擇交換的概率分別為a,b,c,d,e 則拿到20的人,若選擇交換,其收益為 80 20 c 20 10 a,6c a時交換收益大於零,選擇交換 同理,拿到80的人,2d b時選擇交換 拿到200的人,5e 2c時選擇交換。而e 0,a 1 b,c,d ...

突發奇想的博弈論問題

Cici 定理1 不會出現全0的現象。證明 最後一輪所有人都會盡其所能拿金幣,所以剩下的金幣會被均分。非最後一輪故意拿得少的唯一目的就是自己進入下一輪,而別人不能進入下一輪,若A E均選0,F會選擇最大值來達成個人最優。定理2 每一輪第乙個選非零的一定會出局。證明 無論該人選擇多少,其他人都會選擇比...

如何用博弈論來解決寢室衛生問題?

已登出 解決不了,但還是嘗試解決一下。假設你的室友都是懶狗且無所謂寢室是否乾淨。而你又是個正常人,不想寢室髒。那麼博弈矩陣就是這樣的 室友行為 打掃不打掃 你的行為 打掃4,40,8 不打掃8,54,1 括號中前乙個數字代表你的感覺,後乙個數字代表室友的感覺,可以看出你打掃室友不打掃的時候達到了納什...