Reinforcement Learning 和 Game Theory 交叉有哪些重要或有趣的成果?

時間 2021-05-31 12:00:38

1樓:

Minimax Q-Learning: Littman, M. L.

(1994). Markov games as a framework for multi-agent reinforcement learning. InMachine learning proceedings 1994 (pp.

157-163). Morgan Kaufmann.

Nash-Q: J. Hu and M.

Wellman. Nash Q-learning for general-sum stochastic games. Journal of Machine Learning Research, 4:

1039–1069, 2003.

CE-Q: A. Greenwald and K.

Hall. Correlated Q-learning. In Proceedings of the 20th International Conference on Machine Learning, pages 242–249, 2003.

2樓:涮魚座

3樓:若存若亡

馬上想到的有兩個不完全資訊博弈的應用:

1,強化學習打德撲的,Libratus

2,強化學習打星際的,多智慧型體學習

對博弈論了解不多,拋磚引玉一下。

你知道那些有趣的函式?它們有哪些重要意義?

柯羅伊 y 0,既是奇函式又是偶函式。取整函式,呈階梯狀。取小函式,影象很有意思,是斜著的階梯。e x自然指數,可以無限次求導不為0,導數與函式值處處相等。狄利克雷函式,處處黎曼不可積,是乙個無法畫出嚴格影象的函式。勒貝格可積,積出來是0,因為有理數測度為0 威爾斯特拉斯函式,處處連續處處不可導,分...

你和手機有哪些有趣的故事?

magicyoung 十三年前,與初戀吵架,把手機從二樓扔下去。和好後相偕下樓,拾起手機,找到飛散的電池與後蓋,裝好,正常開機,開機畫面裡,兩隻手,指尖相對,下面的logo閃爍如常 NOKIA。還是彩屏的。 碼海茫茫何處岸 用了兩年的手機,剛撕了膜,簡直和新的一樣。同事問道 換新手機了?我解釋一下 ...

你和二哈有哪些有趣的故事?

蛤蟆腿好長 離家出走 養了乙隻哈士奇,對,就是二哈,我們家的這只狗叫 二狗 對,沒錯就是這只。不好意思換一張好看的 非常好,現在開始講我跟二狗的故事。我們在四線的乙個小縣城,跟朋友一起租了個三室一廳,這就是二狗的家了。我們特地給二狗設定了個房間,防止我們都不在家的時候他把家都拆了,現在可以給大家看看...