有研究強化學習(Reinforcement Learning)的不,強化學習的研究價值和應用前景如何?

時間 2021-05-05 19:32:56

1樓:劉景初

Short Answer:

至少得了解一下,但全情投入需謹慎。

------

Long Answer:

之所以建議有基本了解,是因為強化學習涉及人工智慧的根本性問題,想要從事機器學習相關的專業研究,就算只是為了培養基本的intuition也不能對這個領域一無所知。

謹慎的原因是強化學習的潛力是有層次的:基礎理論已經有大神們前赴後繼幾十年,再有新突破困難;應用研究因為深度學習技術的加盟潛力很大,很多古老的好想法可能終於找到了合適的實現形式,近期成果的井噴就是明證;而實際應用則還有待探索,因為強化學習應用的最大障礙不是演算法的問題,而是資料和可靠性等等的綜合性問題,單靠研究是搞不定的。

2樓:

目前已有結合深度學習的案列:看DeepMind如何用Reinforcement learning玩遊戲。

微軟曾利用RL開發出了一款賽車遊戲,可以google搜尋到!!!

強化學習的瓶頸問題仍然未解決(維數災難以及如何快速部署應用......),我也在研究RL這方面,主要與移動機械人導航相結合。

哪些問題不能用強化學習解決?強化學習有哪些侷限性?

shenghuo 強化學習是一種無模型的動態規劃問題,應用的特點是環境因智慧型體的動作而發生變化,獲取的資料沒有標籤,獎勵延遲且稀疏。這導致傳統的基於模型的動態規劃演算法 已知模型轉移概率和獎勵模型 難以奏效,因此需要採用通過不斷與環境互動,獲取 s,a,r,s 資料組,並通過學習或手工設定獎勵函式...

強化學習和傳統的控制有什麼異同點,做強化學習有必要去了解一些傳統控制相關理論的哪些方面呢

笑話 這要取決於題主做的是強化學習based的控制還是深度強化學習based的決策,這個很重要。目前來看強化學習有兩大派別,乙個是早在上世紀90 00年代就已經開始發展並成熟的,用強化學習的方法解最優控制問題的派別。主要的代表人物都是控制相關的比如東北大學張化光,還有Frank Lewis這些人。還...

什麼是逆強化學習?

梵笙 The main idea of inverse reinforcement learning is to learn the reward function based on the agent s decisions,and then find the optimal policy usi...