強化學習（RL）是否是人工智慧的關鍵之處，能夠給人工智慧帶來質變？

1樓：魏光豔

強化學習（Reinforcement Learning, RL）只是人工智慧演算法的一種，它並不能說是人工智慧的關鍵，但是在自動控制和智慧型系統等領域中它確實發揮著獨特的作用，尤其是強化學習中的Q學習已被廣泛應用於路徑規劃及生產排程等組合優化問題中，當問題規模較大時Q學習演算法會導致空間消耗過大，因此在Q學習的基礎上發展出深度強化學習（Deep Q-Network, DQN）方法用於求解大規模動態決策問題。

2樓：科技很有意思

科技就是能看得懂的人工智慧。一年一度的世界級科技大會關注AI準沒錯。https://

3樓：heaven

這取決於你對於「強人工智慧」的具體定義是什麼，是否要求和人完全一樣。

先說結論：首先，我認為強化學習未來肯定可以建立「和人一樣」的智慧型體；其次，人或許等價於強化學習建立起來的智慧型體，也或許有自己的獨一無二的地方——「自由性」或「自為」。

簡單介紹一下概念：在機器學習領域，其他演算法往往是針對特定任務的。例如，人臉識別技術的核心在於建立乙個人臉之間距離的度量（Metric），當需要識別你的臉時它就從資料庫中找出與之最「接近」的臉，並告訴你結果。

因此，「人臉識別」是乙個很好用的工具，屬於「弱人工智慧」的範疇；而強化學習則與之不同，想象我們訓練乙個強化學習模型，它時時刻刻在感知外部的變化，並且依據「最大化效用」的程式設定做出豐富的行為。人們可以根據強化學習技術訓練出頂尖的遊戲AI、能完成各種任務的機械人、比人類司機更安全的無人駕駛系統，甚至可以將這些各種統合在一起形成乙個「足夠複雜」的效用函式……當我們的「狀態」（State）能夠包含足夠多的外部世界資訊，而獎勵（reward）可以涵蓋足夠多方面的時候，我們是不是就能夠造出和普通人類完全無法區分、甚至在很多方面超過人的「強人工智慧」呢？當AlphaGo在對弈的時候，難道你不感嘆於它走法充滿了人類所不及的靈性嗎？

當它擊敗前世界冠軍李世石的時候，難道你沒有感嘆它「已經超越了人類」嗎？

甚至你可以想象，自己是不是就是用強化學習所定義出來的呢？人類是不是就是用強化學習所定義的呢？

有的人會提出反駁，認為人類社會是複雜多樣的。我們從茹毛飲血的原始狀態，創造了哲學思想、政治體制、倫理道德、文化符號，發明了無數的理念，它們共同構成了我們今天豐富多彩的「人間」。如果僅僅讓機械人按照某個設定好的「最大化效用」的規律運轉，如何能夠創造出如此豐富多彩的世界呢？

有的人可能會反駁：我們人有自由的思想。即使面對完全一樣的外部環境，我們也可能產生天馬行空的各種想象。

我此時此刻想起昨晚打輸的遊戲、多年未聯絡的朋友，還是明天中午吃什麼，這完全是由我自由決定的，按規律執行的機械人能做到這一點嗎？

事實上，用機器學習或者強化學習的概念，這些問題都是可以被解答的。換言之，強化學習在未來肯定可以建立「和人一樣」的智慧型體。詳細可以參見我寫的：

余某：哲學基礎2：人是不自由的

當然，這並不意味著人等價於「強化學習建立的智慧型體」。人可能會有它獨一無二的地方，那就是自由性與自為性。如果站在這個角度，我認為強化學習最終是無法做到和人一樣的。

余某：哲學基礎3：人是絕對自由的

余某：1.3.強化學習為什麼重要？

4樓：科技表音字

這個不能急於否定。RL的確是前途無量，當然還要有非監督學習的支撐。目前的數學模型太過簡單，以至於反向傳播的重要性被誇大。其實真正理解RL的人不多。

5樓：

在人類沒有真正想意識的本質研究透徹時，談強人工智慧都是痴人說夢。現在有些科普文章裡把機器學習誇得神乎其神，什麼「下乙個奇點就要臨近」，「強人工智慧將滅亡人類」，說出這類言論的一般都是不太懂ML本質的。

話說回來，相比傳統的連線主義學習（監督、非監督學習），強化學習算是最接近自然界生物學習規律的一種學習正規化，RL在一些小問題上表現近乎完美，但是仍然存在著不少難以解決的問題，應用場景現在還非常有限。

想要實現強人工智慧，還是需要先期待在基礎科學領域能出現劃時代的發現。

如果有興趣學習RL可以看看這個回答

有研究強化學習（Reinforcement Learning）的不，強化學習的研究價值和應用前景如何？ - 知乎使用者的回答

6樓：唐唐唐

也許未來真正的人工智慧的產生/起源方式，完全不同於人類智慧型比較贊同谷歌TensorFlow首頁上提的概念：Machine Intelligence

「智慧型」——只要能解決問題，就是智慧型，不管是以人類的方式，還是以機器的方式——也許機器的方式更佳

期待真正「METALIC」的「機器心靈」的誕生~~~但願有生之年能看到

7樓：張蕊

Neural Network 只是 reinforcement learning的一小部分。

Neural Network 只能實現policy network，但policy gradient才是 reinforcement learning 的重點。參考 Deep Q-Learning。

可惜現在的所有深度學習庫無論是 tensorflow, theano, keras, tflearn, torch, lasagne, caffe 都只是提供 neural network框架。而沒有提供開源任何的 reinforcement learning 框架。

最近開源的 TuneLayer 是唯一乙個支援 reinforcement learning 的庫，而且是基於TensorFlow開發的，可以參考一下： https://github.

8樓：

從商業的角度來看，計算廣告目前是人工智慧應用較多的領域，你們在提出這個想法的時候有考慮buyer的需求嗎？YY這些東西有用嗎？

9樓：易安

最近怎麼這麼多人工智慧的話題，又大多沒說到點上。人工智慧最大的瓶頸還不是硬體，而是軟體，程式的核心都不知道該怎麼編寫，因為目前所有的科學家和軟體工程師們都不知道「智慧型」（準確的說是「思考能力」）的本質是什麼，"How do you konw you 'can konw' "！記得小時候看過一部關於機械人的科幻電影，乙個機械人被雷劈了以後突然產生了自我意識，也許未來的第乙個真正的人工智慧也是在無意中產生的吧，我個人覺得這是最有可能的實現的辦法了。

10樓：我是小熊貓

AI是塊大蛋糕，本質上解決AI的問題必須解決unsupervised learning的問題。而強化學習介於supervised learning和unsupervised learning之間，所以能幫助解決人工智慧的很多實際問題。

11樓：

我比較關注的乙個問題是，機器和人在解決問題（數學）上的模式如何同化。對乙個接受過科學訓練的人而言，我們的步驟一般是提取條件，提取需要得出的結果，然後建立數學聯絡求解。構建數學模型是這樣，就連解最簡單的那種小學應用題也是這樣。

但是就是在解小學應用題上使用RL也基本上做不到。這是我覺得可以做很多研究的地方，事實上也確實很多人在做。我上Sutton的課的時候他也曾經提到過類似的東西。

12樓：文刀叉點

現在談人工智慧太早了

知乎好多人根本什麼都不清楚，就左一句人工智慧，右一句人工智慧的

業界不少站在頂點的人，都不會輕易把人工智慧拿出來說，因為他們心裡很清楚差距有多大

強化學習（RL）是否是人工智慧的關鍵之處，能夠給人工智慧帶來質變？

什麼是人工智慧？人工智慧機器學習深度學習三者之間有什麼關係嗎？

人工智慧和人工智慧深度學習是通過怎樣的原理實現的？

如何激怒一位人工智慧（機器學習深度學習強化學習等）愛好者？

其他用戶還看了：

強化學習（RL）是否是人工智慧的關鍵之處，能夠給人工智慧帶來質變？

什麼是人工智慧？人工智慧 機器學習 深度學習三者之間有什麼關係嗎？

人工智慧和人工智慧深度學習是通過怎樣的原理實現的？

如何激怒一位人工智慧（機器學習 深度學習 強化學習等）愛好者？

其他用戶還看了：

什麼是人工智慧？人工智慧機器學習深度學習三者之間有什麼關係嗎？

如何激怒一位人工智慧（機器學習深度學習強化學習等）愛好者？