誰能詳細講講囚徒困境?

時間 2021-05-06 14:34:46

1樓:我的酒館不打烊

不羅列概念,直接舉例:

囚徒困境

「囚徒的困境」是成名於2023年塔克(Tucker)演進的經典博弈問題。該問題非常簡單,卻能很好地反映博弈問題的根本特徵,也是有效解釋眾多經濟現象的基本模型。該問題提出後引發了大量的相關研究,對博弈論的發展起了不小的推動作用。

下面是作者改編的版本。

警察抓住兩個合夥犯罪的罪犯,但缺乏足夠證據指證他們的罪行。如果其中至少一人供認犯罪,就能確認罪名成立。為了得到所需的口供,警察將兩名罪犯分別關押以防止串供或結成攻守同盟,並給他們同樣的選擇機會:

1. 如果兩人都拒不認罪,則他們會被以較輕的妨礙公務罪各判1年徒刑;

2. 如果兩人中有一人坦白認罪,則坦白者從輕處理,立即釋放,另一人則將重判8年徒刑;

3. 如果兩人同時坦白認罪,則他們將被各判5年監禁。

決策本博弈的博弈方是兩個罪犯,我們分別稱「囚徒1」、「囚徒2」,但只制定規則、自身不參與決策活動的警察則不是博弈方;本博弈兩個博弈方都有「不坦白」和「坦白」兩種可選擇策略;因為兩個囚徒被隔離開,其中任何一人選擇策略時都不可能知道另一人的選擇是什麼,因此不管他們決策的時間是否真正相同,我們都可以認為他們是同時決策的。

如果分別用-1、-5和-8表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即釋放的得益,則可以用圖1.2所示的得益矩陣將這個博弈表示出來。在圖1.

2中,矩陣的每個元素都是兩個數字組成的陣列,表示所處行列對應的兩博弈方策略的組合下的雙方得益。其中,第乙個數字為選擇行策略的囚徒1的得益,第二個數字為選擇列策略的囚徒2的得益。

根據個體理性行為準則,兩個博弈方的目標都是實現自身的最大利益。他們該怎樣選擇策略呢?

首先可以肯定的是,在這個博弈中,兩博弈方各自的利益不僅取決於他們自己選擇的策略,也取決於對方的策略選擇。每個博弈方選擇自己的策略時,即使無法知道另方的實際選擇,也必須考慮另一方有兩種可能的選擇,而且另一方的選擇對自己的利益影響很大。

例如對囚徒1來說,假設囚徒2選擇的是「不坦白」,自己選擇「不坦白」得益-1,「坦白」得益0,他應該選擇「坦白"(根據個體理性原則,囚徒1不會關心對方會被重判8年的問題);假設囚徒2選擇的是「坦白」,則囚徒1「不坦白」得益-8,「坦白」得益-5,還是應該選擇「坦白」。因此,本博弈中無論囚徒2採用何種策略,只考慮自身利益的囚徒1的唯一.選擇是「坦白」。

「坦白」是囚徒1的乙個「上策"(dominant strategy)。

因為囚徒2的情況與囚徒1完全相同,因此囚徒2的策略選擇應該與囚徒1完全相同,唯一選擇也是「坦白」,「坦白」也是囚徒2的「上策」。所以,該博弈的最終結果必然是兩博弈方都選擇「坦白」,同獲得益-5,即都被判5年徒刑。

值得注意的是,在這個博弈中,無論是對兩個囚徒總體來講,還是對他們各自來講,最佳的結果都不是同時「坦白」各得-5,因為都「不坦白」各得一1顯然比都「坦白」各得一5好得多。但是,由於兩個囚徒不能串通,並且各人都追求自己的最大利益而不會顧及同夥的利益,因此只能實現對他們都不理想的結果。這也是該博弈被稱為「囚徒的困境」的原因。

當然,囚徒的困境對社會利益來說是理想的,因為罪犯都受到了應有的懲罰。但從博弈中兩個決策者的立場上說則很不理想,因為既沒有實現兩人總體的最大利益,也沒有真正實現自身的個體最大利益。

囚徒的困境博弈的重要意義,在於類似的情況在社會經濟中有很大的普遍性,在市場競爭的各個領域,在資源利用和環境保護,以及政治、軍事和法律等各種領域的問題中,都存在類似囚徒的困境現象。

2樓:小豪L

職場裡的囚徒困境

囚徒困境是說,兩個共同犯罪的人被關進監獄,彼此不能溝通,如果兩個人都選擇不檢舉對方(合作),那警察就找不到證據,兩個人都只需要做一年牢;如果一人檢舉對方(背叛),而另一人沉默,則檢舉者因為立功而可以立刻釋放,沉默者因為不合作而入獄十年;如果互相檢舉,則證據確鑿,兩個人都判八年。

現在的職場,是典型的囚徒困境難題。

和囚徒困境一樣,當每個人都選擇合作時,大家皆大歡喜,錢多事少。但在職場當中,員工之間的資訊是不透明的,你不知道在你摸魚的時候,你的同事會不會跑到老闆面前當乙個奮鬥逼,每個人都會擔心這一點,最好的解決方法就是觀察同事,別人摸魚我也摸魚,別人下班我也下班,和大步調保持一致,總歸不會出大錯。

和員工的利益點不同,幾乎每個老闆都希望公司有盡可能多的奮鬥逼存在,以便他們就花更少的錢獲得更聽話的員工,所以他們會極力促成員工之間的「背叛」,把每個員工單獨拉到小黑屋談心,許諾更高的薪資和職位,鼓勵他們好好工作。

一旦有人聽信了老闆的讒言,開始埋頭苦幹,所有人就跟著倒霉,合作的局面被打破,有人觀察到同事「好像變努力了」,自己就也得跟上腳步,成為看上去很努力的樣子,接著惡性迴圈,大家只能為了不被開除,更加努力地工作。

最後導致的結果往往是,每個人都加了更多班,承受了比以前更多的工作量,工資待遇卻沒有漲,以往不加班可以獲得的薪水,現在要靠加班才能保住職位。

3樓:Gavin

說白了就是兩個實體,a和b,本來聯合起來是更有利的。但是因為種種原因不能聯合,因此只能自己為自己打算。自己的利益看似最大化了,但其實如果和聯合來比的話,其實是最小化了。

4樓:毛晨

發現很多人都沒講明白核心。

具體問題就不描述了,大家都說了。

核心問題是,站在每個人的角度來看,無論對方怎麼選,自己都是選擇招供收益更大。然後從自己角度來考慮,自然要選擇招供對方了。所以最後結果就是雙方都招供,雙方都入獄。

囚徒困境描述的是個體利益的最優選擇經常會跟群體利益的最優選擇矛盾,每個人都按對自己最好的方法選擇了,實際上得到了對大家都不好的結果。

5樓:眉清目秀的段子手

囚徒困境是博弈論的一種。博弈裡拿對方的籌碼,為自己下注的方式。

由於資訊無法溝通,無法在每個階段都信任對方,導致一旦對方拿自己做籌碼。自己會陷入被動。警徽的主要工作,就是不斷明示暗示對方已經背叛而自己最佳選擇就是背叛。

囚徒困境的弱點並不只有信任,這是乙個花別人錢為自己買單的行為。沒有有效保證自己財務安全的方式,導致大家內卷。

其實真正理性的人不會陷入囚徒困境,因為這涉及到乙個賠率問題。通常情況下賠率都會小於1。

因為是花別人錢,除非有辦法防止對方拿回自己花的掉的。否則對方一定會拿回去。

有幾種方式拿回去,因為大部分不可能只犯案一起,可以事後舉報。

利用第三方報復。一般有組織的都會成立第三方來約束大家。

囚徒困境,和最近很火的內捲很像。

內捲又有所不同,內捲是生產力沒有提高的情況下,爭奪資源。就會導致付出增加收益不變,導致付收比降低。

很像的原因也是信任缺失,不同的是作為強力第三方很難把握懲戒力度,力度過大。會導致積極性缺失。會導致生產力降低。

並且對於第三方來說,生產力降低一定程度上比內捲更可怕,所以第三方可以容忍一定程度的內捲。

如何有效破解內捲啦?簡單的說根本沒有辦法,因為內捲的內是指全世界。

看了大劉的贍養上帝後發現,內卷問題即是解決。生產力降低就成了不可避免的新問題!

人類的能力是有極限的。我從短暫的一生中學到一件事。人越是工於心計,反而容易陷入意想不到的困境,前功盡棄。除非成為超越人類的存在。

想要破解內卷,只能設定金錢與榮譽兩套報酬。貢獻達到一定範圍內給與金錢,超出給與榮譽。根據歷史經驗來看。

榮譽報酬由於無法購買到實物,導致特別容易超發,構成體系崩潰。這些問題都解決了。就剩下乙個問題,內捲的內指的是全世界。

那就必須人類世界大統一。並一直配上乙個強有力的領導層!從歷史上來看根本不可能。

那就只有另一種辦法了!小規模解決,和圈子裡人達成共識,設立乙個付出比範圍。一旦有人低於或者高於,就出面進行干涉。這個是目前來說最符合。也是最容易達成的方法!

這個方法用到的理論是均分蛋糕中的,乙個蛋糕分成兩份,兩人都選擇其中一塊的時候,將這塊蛋糕切一塊分到另一塊去。一直迴圈,直到兩人選擇不同。兩人就可以開始吃蛋糕了。

6樓:賴邢施

囚徒困境是指:兩個共謀犯罪的人被關入監獄,不能互相溝通情況。如果兩個人都不揭發對方,則由於證據不確定,每個人都坐牢一年;若一人揭發,而另一人沉默,則揭發者因為立功而立即獲釋,沉默者因不合作而入獄五年;若互相揭發,則因證據確實,二者都判刑兩年。

由於囚徒無法信任對方,因此傾向於互相揭發,而不是同守沉默。

7樓:早睡早起

囚徒困境

囚徒困境的提出,和博弈論有關,而博弈論的前提是理性人假設,囚徒困境是博弈論應用的乙個例子,但之所以提出囚徒困境,又把理性人設定成囚徒,其實是理論的提出者,很明顯地注意到了

人在社會中,就是理性的囚徒

先說囚徒,人心隔肚皮,每個人的利益是不一致的,人和人互相之間就如囚徒一般,無法真正的談心,也無法真正的相互信任,隨時可能遭到背叛,我們的心,就在兩個囚徒在相鄰牢房中,永遠無法相遇相知相守,所以人和人之間的聯絡,實際上就是囚徒在各自的牢房中的聯絡

而理性,則是囚徒的自我邏輯思維(因果關係)的素質

所以囚徒困境中的理性人博弈,實質上就是真實經濟體中每個人博弈的簡化縮影

這就是囚徒困境和博弈論的偉大和有趣之處,也是經濟分析的基石,微觀經濟分析的研究物件,其實是人,怎麼分析和影響人的交易決策

這個囚徒困境是一切博弈的基石

8樓:務序

在有限博弈中,為了防止他人背叛傷害到自己,而選擇先背叛他人保護自己。結果參與者都會這麼思考行動,這種一致性稱為「納什均衡」。

9樓:毀三觀

囚徒困境的本質是在資訊不對稱的環境下做出選擇,但在這個困境之中,實際上並沒有對於囚徒來說有利的選擇,他們只是在所有不利選擇中選擇傷害最小的那個選擇。這個問題混淆了有利與不利的概念,實際上是一種認知誤導。因此,用這個假設論證理性實際上是乙個法利賽陷阱,也就是高智商耍弄低智商,資本家耍弄無產者的小把戲。

地方財政的囚徒困境

哈兒 不知道你還能不能看到回覆了,我和老公也是每次生氣都說離婚分開,我先都很崩潰了,為什麼人家夫妻吵架生氣,就是動手也不會說離婚,我們每次都說老公說我總是抱怨總是不甘於現狀不懂得滿足,我有時候是抱怨。是覺得他管我管的太多了,我們是異地,我和她父母在一起生活,他總是說他不在家不讓我出去和他的朋友在一起...

囚徒困境 有哪些現實的例子?

餘生餘安啊 乙個有一點味道的回答 前提 在公共廁所上廁所 某些廁所沖水的裝置為按水平方向按進去出水的那種 作為乙個剛上完廁所的人,儘管從高度上看是設計為手按的,但看著有些髒兮兮的沖水裝置你沒法確定之前的人是用手按的還是用鞋底,於是最優方式是直接用鞋底規避手沾到穢物的風險,而每個人都面對著同樣的抉擇時...

聰明人會如何選擇囚徒困境

折雲 真正陷入囚徒困境的話是實在想不出來什麼辦法解決了,唯一還能想到的就是,選擇合作夥伴的時候選可信度高的,雙方進行約定,這就是能想到的最後的困獸之鬥了。 伊禮呵撒稜 現實中怎麼會有完美的囚徒困境,你們兩個不能交流?還是不願意交流?還是大家鐵了心都不選合作?能交流?抱歉,這不是囚徒困境,那要看個人語...