強化學習(RL)是否是人工智慧的關鍵之處,能夠給人工智慧帶來質變?

時間 2021-05-06 15:16:45

1樓:魏光豔

強化學習(Reinforcement Learning, RL)只是人工智慧演算法的一種,它並不能說是人工智慧的關鍵,但是在自動控制和智慧型系統等領域中它確實發揮著獨特的作用,尤其是強化學習中的Q學習已被廣泛應用於路徑規劃及生產排程等組合優化問題中,當問題規模較大時Q學習演算法會導致空間消耗過大,因此在Q學習的基礎上發展出深度強化學習(Deep Q-Network, DQN)方法用於求解大規模動態決策問題。

2樓:科技很有意思

科技就是能看得懂的人工智慧。一年一度的世界級科技大會關注AI準沒錯。https://

3樓:heaven

這取決於你對於「強人工智慧」的具體定義是什麼,是否要求和人完全一樣。

先說結論:首先,我認為強化學習未來肯定可以建立「和人一樣」的智慧型體;其次,人或許等價於強化學習建立起來的智慧型體,也或許有自己的獨一無二的地方——「自由性」或「自為」。

簡單介紹一下概念:在機器學習領域,其他演算法往往是針對特定任務的。例如,人臉識別技術的核心在於建立乙個人臉之間距離的度量(Metric),當需要識別你的臉時它就從資料庫中找出與之最「接近」的臉,並告訴你結果。

因此,「人臉識別」是乙個很好用的工具,屬於「弱人工智慧」的範疇;而強化學習則與之不同,想象我們訓練乙個強化學習模型,它時時刻刻在感知外部的變化,並且依據「最大化效用」的程式設定做出豐富的行為。人們可以根據強化學習技術訓練出頂尖的遊戲AI、能完成各種任務的機械人、比人類司機更安全的無人駕駛系統,甚至可以將這些各種統合在一起形成乙個「足夠複雜」的效用函式……當我們的「狀態」(State)能夠包含足夠多的外部世界資訊,而獎勵(reward)可以涵蓋足夠多方面的時候,我們是不是就能夠造出和普通人類完全無法區分、甚至在很多方面超過人的「強人工智慧」呢?當AlphaGo在對弈的時候,難道你不感嘆於它走法充滿了人類所不及的靈性嗎?

當它擊敗前世界冠軍李世石的時候,難道你沒有感嘆它「已經超越了人類」嗎?

甚至你可以想象,自己是不是就是用強化學習所定義出來的呢?人類是不是就是用強化學習所定義的呢?

有的人會提出反駁,認為人類社會是複雜多樣的。我們從茹毛飲血的原始狀態,創造了哲學思想、政治體制、倫理道德、文化符號,發明了無數的理念,它們共同構成了我們今天豐富多彩的「人間」。如果僅僅讓機械人按照某個設定好的「最大化效用」的規律運轉,如何能夠創造出如此豐富多彩的世界呢?

有的人可能會反駁:我們人有自由的思想。即使面對完全一樣的外部環境,我們也可能產生天馬行空的各種想象。

我此時此刻想起昨晚打輸的遊戲、多年未聯絡的朋友,還是明天中午吃什麼,這完全是由我自由決定的,按規律執行的機械人能做到這一點嗎?

事實上,用機器學習或者強化學習的概念,這些問題都是可以被解答的。換言之,強化學習在未來肯定可以建立「和人一樣」的智慧型體。詳細可以參見我寫的:

余某:哲學基礎2:人是不自由的

當然,這並不意味著人等價於「強化學習建立的智慧型體」。人可能會有它獨一無二的地方,那就是自由性與自為性。如果站在這個角度,我認為強化學習最終是無法做到和人一樣的。

余某:哲學基礎3:人是絕對自由的

余某:1.3.強化學習為什麼重要?

4樓:科技表音字

這個不能急於否定。RL的確是前途無量,當然還要有非監督學習的支撐。目前的數學模型太過簡單,以至於反向傳播的重要性被誇大。其實真正理解RL的人不多。

5樓:

在人類沒有真正想意識的本質研究透徹時,談強人工智慧都是痴人說夢。現在有些科普文章裡把機器學習誇得神乎其神,什麼「下乙個奇點就要臨近」,「強人工智慧將滅亡人類」,說出這類言論的一般都是不太懂ML本質的。

話說回來,相比傳統的連線主義學習(監督、非監督學習),強化學習算是最接近自然界生物學習規律的一種學習正規化,RL在一些小問題上表現近乎完美,但是仍然存在著不少難以解決的問題,應用場景現在還非常有限。

想要實現強人工智慧,還是需要先期待在基礎科學領域能出現劃時代的發現。

如果有興趣學習RL可以看看這個回答

有研究強化學習(Reinforcement Learning)的不,強化學習的研究價值和應用前景如何? - 知乎使用者的回答

6樓:唐唐唐

也許未來真正的人工智慧的產生/起源方式,完全不同於人類智慧型比較贊同谷歌TensorFlow首頁上提的概念:Machine Intelligence

「智慧型」——只要能解決問題,就是智慧型,不管是以人類的方式,還是以機器的方式——也許機器的方式更佳

期待真正「METALIC」的「機器心靈」的誕生~~~但願有生之年能看到

7樓:張蕊

Neural Network 只是 reinforcement learning的一小部分。

Neural Network 只能實現policy network,但policy gradient才是 reinforcement learning 的重點。參考 Deep Q-Learning。

可惜現在的所有深度學習庫無論是 tensorflow, theano, keras, tflearn, torch, lasagne, caffe 都只是提供 neural network框架。而沒有提供開源任何的 reinforcement learning 框架。

最近開源的 TuneLayer 是唯一乙個支援 reinforcement learning 的庫,而且是基於TensorFlow開發的,可以參考一下: https://github.

8樓:

從商業的角度來看,計算廣告目前是人工智慧應用較多的領域,你們在提出這個想法的時候有考慮buyer的需求嗎?YY這些東西有用嗎?

9樓:易安

最近怎麼這麼多人工智慧的話題,又大多沒說到點上。人工智慧最大的瓶頸還不是硬體,而是軟體,程式的核心都不知道該怎麼編寫,因為目前所有的科學家和軟體工程師們都不知道「智慧型」(準確的說是「思考能力」)的本質是什麼,"How do you konw you 'can konw' "!記得小時候看過一部關於機械人的科幻電影,乙個機械人被雷劈了以後突然產生了自我意識,也許未來的第乙個真正的人工智慧也是在無意中產生的吧,我個人覺得這是最有可能的實現的辦法了。

10樓:我是小熊貓

AI是塊大蛋糕,本質上解決AI的問題必須解決unsupervised learning的問題。而強化學習介於supervised learning和unsupervised learning之間,所以能幫助解決人工智慧的很多實際問題。

11樓:

我比較關注的乙個問題是,機器和人在解決問題(數學)上的模式如何同化。對乙個接受過科學訓練的人而言,我們的步驟一般是提取條件,提取需要得出的結果,然後建立數學聯絡求解。構建數學模型是這樣,就連解最簡單的那種小學應用題也是這樣。

但是就是在解小學應用題上使用RL也基本上做不到。這是我覺得可以做很多研究的地方,事實上也確實很多人在做。我上Sutton的課的時候他也曾經提到過類似的東西。

12樓:文刀叉點

現在談人工智慧太早了

知乎好多人根本什麼都不清楚,就左一句人工智慧,右一句人工智慧的

業界不少站在頂點的人,都不會輕易把人工智慧拿出來說,因為他們心裡很清楚差距有多大

什麼是人工智慧?人工智慧 機器學習 深度學習三者之間有什麼關係嗎?

祩徍徍 人工智慧是乙個很寬泛的概念,各種定義都有,機器學習是人工智慧的一種實現方法,深度學習是機器學習的一種實現方法,是在機器學習的基礎上建立起來的,深度學習最基本的形式就是神經網路。 王易諾 人工智慧 英語 artificial intelligence,縮寫為AI 是指由人製造出來的機器所表現出...

人工智慧和人工智慧深度學習是通過怎樣的原理實現的?

C飛花逐夢 人工智慧實際上是乙個很大的概念,而深度學習是其中的乙個重要分支,或者說是一種重要方法。實際上深度學習背後的神經網路概念很早就有提出,隨著算力的提高,以及BP等理論的提出,過去認為不太可行的做法現在變得可行了,深度學習近年來的大熱離不開這樣的背景,而深度學習的成功應用也一下子把AI再次推向...

如何激怒一位人工智慧(機器學習 深度學習 強化學習等)愛好者?

DeviliveD 說下面這句話 什麼深度學習,神經網路,不就是 generalized non linear regression 嗎,都是統計的東西。另外,如果深度學習愛好者很容易被激怒的話,他 她 they 大概不是太年輕,就是有些章節還沒有看到吧。 1.你conda環境崩了 2.你用的什麼顯...