強化學習必須得從零開始學習嗎?DQN中Q eval的神經網路引數可以自定義初始化嗎?

時間 2021-05-14 10:51:04

1樓:

André Barreto 曾在 2016 年做過乙個 Successor Features for Transfer in Reinforcement Learning 的工作。回答的是強化學習中的遷移。可能是更好的思路。

回到這個問題,個人覺得初始化影響不是很大,尤其是 DQN 這種。最終加了很多 tricks 後基本還是能夠收斂的。

2樓:夢想做個翟老師

深度強化學習的網路引數一般都是隨機初始化的,那是因為DRL演算法的泛化性很差,就是很多時候你針對乙個任務訓練好乙個模型,這個模型就只對這個任務有效,對其它任務就不work了。當然如果任務之間有很強的相關性,你完全可以用已經在乙個任務上訓練好的網路引數去初始化另乙個任務(遷移學習的概念),或者就像你說的那樣通過前期的資料(例如專家知識)對Q初始化引數。

3樓:小小程式猿

完全可以,一開始你就把Target網路和eval網路賦值成你想要的網路就可以了,相當於你初始化乙個策略替代隨機策略,然後在這個基礎上去尋找最優的策略。

如何從零開始學習計算化學?

yqqiu 第一條回答得很不錯。另外想說得是,計算化學裡面無論是哪種語言還是哪種軟體都只是工具,關鍵還是,你想解決什麼化學問題,如何解決,說到底最關鍵得還是化學基礎。量子化學,動力學,熱力學,統計力學,這些都要好好順一遍。概念要清晰,糊里糊塗的知道一些公式名字,會算幾個考試題是沒什麼用處的。最後,如...

請問如何從零開始學習CFD?

ADILEE 先入門,學習安德森的計算流體力學基礎及其運用,然後同時要學習使用軟體,然後掌握一門程式語言,可以自己寫一些程式,做後選擇乙個方向,做一些工程專案 先學好這幾門課程 數學分析 張量分析 流體力學 計算方法 偏微分方程數值解法 數學物理方程。然後CFD要掌握的不過是方程的離散方法 FVM ...

如何從零開始入行機器學習?

星辰大海 從人工神經網路開始學習,是乙個不錯的選擇,包括1 全連線神經網路 全連線神經網路通常是作為入門基礎。全連線神經網路 2 卷積神經網路 卷積神經網路使用了卷積層,可以拆分成 區域性連線 和 權值共享 兩個概念。卷積神經網路 3 殘差網路 殘差網路有許多跨層連線,這是它的核心貢獻。殘差網路 4...