1樓:
無人指導下的學習不就是reinforcement learning麼...機器在不知道任何先驗知識的情況下自己感知環境(state),根據一定的策略(policy),作出動作(action)後獲得環境反饋的獎勵(reward),並且進入下乙個state...
然後機器自己通過不斷地迭代改進策略...
人類只是定義了問題和迭代框架...
2樓:fly qq
算有吧。無人指導下的學習 = Unsupervised Learning
這個問題其實就涉及到學者對機器學習的分類了:監督學習Supervised Learning, 強化學習Reinforcement Learning, 無監督學習Unsupervised Learning
Supervised Learning:應該是目前應用最廣泛的機器學習類別了。就是提供一系列有標記的資料給機器學習演算法,讓這些演算法學習到標記資料的規律。
具體應用可以是分類(classification)或者回歸(regression),演算法如決策樹、貝葉斯、SVM、隨機森林、神經網路等。但這種機器學習方法對訓練資料非常依賴。
例如下面這類題目,我們人類能夠根據給定的訓練資料,正確判斷測試資料對應的結果。當然,現在的機器學習演算法需要更多的資料集。
Reinforcement Learning:這個是另外一大類機器學習方法,大概就是通過定義獎懲機制,讓機器不斷嘗試、搜尋出合適的策略。這類方法有點類似於控制方法,最終找到的策略就是根據當前狀態給出對應的動作,最近很火的AlphaGo就是用的類似方法。
當然,演算法的話,有Q-learning,TD-learning,Deep Reinforcement Learning等。
這類演算法相比於監督學習,對標記資料的要求或者說人類的介入就更少了,我們只需要指定乙個目標,讓機器不斷嘗試就行了。畢竟,我們使用機械人的時候是會希望它能實現某些功能,因此,必然存在某些評價指標,所以,我認為RL會是下一階段機械人的爆發點。
Unsupervised Learning:這應該是機器學習研究者的終極夢想了,就是我們不需要給資料做標記、也不需要特別指明目標,演算法就能在一堆未標記資料中找到可用的資訊。應用可以是聚類、異常檢測、資料降維等。
演算法有k-means,PCA等。這部分的內容還有待進一步研究,就連我們人類自身,在面對不同的分類問題時,不同人都可能給出不同結果。
例如下面這類題目,有些人可能會認為答案是(b)帽子不是容器;但也有人認為是(d)沒有把手。
強人工智慧實現後,人類仍需要深度思考嗎?
春秋物語 人工智慧的發展基於研究人類大腦處理資料的模式,也就是人類的思維 行為與習慣。它是基於人類的思維 行為 習慣來執行的。但是人的這些行為都有乙個先天bug,人類的大腦無法想象 理解從未出現的東西與知識,也就是隨著各種因素的進展會出現更多的全新的東西,這些東西又是需要乙個漫長的過程去學習 消化與...
人工智慧需要哪些技術基礎?
永無止境 一些基礎性的深層網路結構,是有必要學習的,例如 卷積神經網路 AlexNet AlexNet在2012年的ImageNet競賽中奪得冠軍,使得卷積神經網路一舉封神。AlexNet 殘差網路 殘差網路是卷積神經網路最為經典的改進形式,下圖中的identity 即恒等路徑 是其核心貢獻。深度殘...
學人工智慧需要學習什麼語言?
Beilier 最主要的是python,用於原型快速開發。根據實際專案可能需要多語言協作。比如遊戲指令碼lua,unity c 如果到機械人控制上,c和c 也是必備的。c 上強化學習,深度學習,視覺檢測都可以做。 GANZI 首先,目前學習人工智慧最合適的語言就是Python,Python因為人工智...