當前多智慧型體強化學習的發展方向有哪些?

時間 2021-05-11 17:42:26

1樓:Chersophyte

Framework Algorithms的工作包括以下幾個分類:

目前集中於mixed task與dynamic task。包含在joint action learning,Cooperation和Competition三個track內。

然後關於reward function,Security,Self-play是比較少,但是每年穩定有production的track。

Learning to communicate和Transfer Learning in MARL framework型的工作很少。

最後是每年趨勢穩定上公升的Inverse Reinforcement Learning,還有大火的Meta Learning也有在MARL下的玩法。

理論性的工作我印象比較深刻的有Wellman的用Banach不動點證明joint action learning的Equilibrium Convergence。

總體來講Multi-Agent Reinforcement Learning沒有非常nontrivial的理論工作。尤其在RNN和Transformer壟斷POMDP這個很容易有理論結果的track之後,理論性的工作越來越少了。

智慧型家居的未來發展方向?

劉毅卿01bc 損害人精氣神的,一般是人。負面人,事情多的人。身體差的人。這些人,您接觸多了。您就萎靡了。您把這些人斷絕了,就好了。尖銳的問題和劈頭蓋臉的壓力,不斷的讓我成長。我們都是在一次次失敗中越來越清晰自己的弱點,越來越理解自己的長處。越來越明確自己的方向。節約時間,猛幹吧。把工作做到極致,把...

當前顯示技術的發展方向為何是OLED(有機發光二極體),為何要用壽命較短的「有機物」?

楊洋 因為OLED除了耐用性,基本上碾壓LCD。色彩更飽滿,功耗更低,最重要厚度只有LCD的一半,如果手機想做的更薄,OLED是必須的。耐用性這一塊除了燒屏其實更重要的是OLED的維修成本。因為自發光的緣故所以不存在內外屏一說,想換就要換整個螢幕模組。S8螢幕1600。IPX三千多。OLED還是太金...

模式識別機器學習的發展方向?

超越 既然對模式識別 機器學習這方面比較感興趣,那麼建議從卷積神經網路這一類開始學,例如 1 卷積神經網路 卷積神經網通過採用卷積,極大規模地減少了引數的數量。卷積神經網路 2 深度殘差網路 深度殘差網路的主要特色,就是下圖中的恒等通路。深度殘差網路 3 深度殘差收縮網路 深度殘差收縮網路 1 2 ...