如何看待人機大戰第四局李世石戰勝 AlphaGo?

時間 2021-05-06 16:25:15

1樓:find goo

神經網路,深度學習,智慧型演算法,說白了,還是乙個概率問題,如果長時間多次數下後,電腦會出現一定概率輸掉的特徵,這是神經網路的黑箱系統的不確定性的存在。

這個漏洞是可怕的,也是不能補救的。

無人駕駛系統,也會出現這樣的問題,在正常中出現隨機性的錯誤,是智慧型演算法固有的缺陷。

智慧型演算法只是一種擬合,在高維度下,不是天衣無縫的,會出現一定的概率性錯誤,這就是擬合的非完全性造成的。

2樓:無名蜀輩

沒看其他回答,不知道有人提到這種可能沒有,人機大戰可能只是圍棋界和人工智慧界的炒作,所以他們的目的並不是大多數人以為的那樣,在我看來,現在的電腦是可以完勝人類的,不管這人是不是世界冠軍,但是李竟然勝了一局,為什麼呢?很顯然五比零不怎麼好看也缺少戲劇性,而且也不利於大家什麼時候在搞個人機大戰。

3樓:

返場哈撒比斯的講座

答主和silver的合影 (懶得用馬賽克技術直接截了)

====分割線下原回答===

今天我去了silver的演講,結束之後一群人向他提問題。

我簡單說明一下。

我問:「78手之後電腦怎麼回事?一萬分之一的概率並不是好的解釋啊。」

他說:「它就這麼下了。」

我說:「難道電腦發現這一萬分之一漏算了不重新搜尋麼?,」

他說:「重新搜了。」

我說:「那難道重新搜不是應該能搜到正確結果麼?」

他說:「嗯……事實顯示沒有。」

我還想問電腦如何分配時間的問題,但是我已經問了三個,他覺得要給其他人機會,於是我不好意思問了。

乙個女生問:「要是我下臭棋怎麼辦?」

他說:「你會輸得更快。」

『結合歷史的第一局不用連環劫,第五局的吃大頭鬼等等各種「失誤」(失誤指的是明顯有其他棋比這個好),我很大概率確定

那就是:

alphago由於為了保持網路的穩定性,只會在輸的情況才會調整神經元的權值,贏的時候不管。

首先我們要認識到一件事情,就是alphago 訓練的其實是剪支,去掉那些「顯然」不正確的選項,剩下的再搜尋。

人類學習的程序,是包括做死活題,手筋題等。人類所掌握連環劫,大頭鬼,覺得電腦「有了幾段的實力這些東西應該都知道」其實是乙個誤區。那些題目是搜尋所有的分支找到最優解,而alphago,我說過,訓練的是如何砍掉分支。

再說,人類學習死活題,手筋,就以大豬嘴為例子。都是「給一張圖,黑先白死」。

而alphago學習大豬嘴,是「這個大豬嘴影響勝負的時候」才會去學習。也就是說,電腦要是每次都吊打我二十幾目,這個時候,我搞出大豬嘴,活了,但是我輸了,電腦其實是對自己的網路很滿意的。根本不會追究「活生生放走一片」的責任

不過,要是我能把棋控制成,「最後剩乙個大豬嘴,活了我贏棋,死了我輸棋」,這個時候電腦才會好好對待這個大豬嘴。我活了,我贏棋了,這說明alphago的網路出問題了,剪枝剪錯了,才會「正式」去找如何殺這個大豬嘴的方法。

(因為alphago有一定由估值網路推動的的舉一反三能力,所以完全有可能它在沒有大豬嘴的棋中訓練出了乙個非常好的價值網路,導致出現大豬嘴也能良好的剪支)

這麼看起來alphago其實是乙個重度拖延症患者。而且沒有什麼上進心,別的孩子拼命想考100,但是alphago寫完60分的題,就有點打算交卷了,後面的題就不那麼認真了,要是監考老師要是走到旁邊說:「嗯你及格了。

」他就覺得自己可以了就直接把卷子交了。你說他不用功,他說,我及格了,怎麼著吧!所以他的漏洞其實很多,但是不少問題被他的及格所掩蓋了。

只要人類能穩定的把他漏洞暴露到及格邊緣,他才會開始糾錯。

大家都說alphago 收束強,那是必然,因為每局都有收束,所以各種收束官子基本都練習過了,弱點相對較少。

換句話說,當你發現 alphago 不懂連環劫,不懂大頭鬼,其實是alphago告訴大家,它的訓練過程中,基本沒有收束到「打到連環劫,決定勝負」,也沒有遇到「放了對方乙個大頭鬼,自己輸了」 的局。

綜上,白78其實很單純,就是alphago從來沒有訓練到這個型別的局,於是敗了,當然,這個敗也基本只是敗一次的。也就是說,alphago的剪支和搜尋其實漏算了非常非常多的局,但是漏算的這一部分中,又有絕大多數是alphago贏了的局,從這麼看來,alphago其實是挺粗糙的,還有很多可以影響它神經元權重的對局樣本需要收集。但即使是這麼粗糙的alphago,還能吊打李世石。

想起藤澤秀行說:棋道一百,我只知

六、七。

順帶,今天別人問過,silver說讓子棋和分先棋alphago是分開處理的。

4樓:我就不說

實在不懂人工智慧,也不懂圍棋,但並不影響乙個普通人對這個事物的理解。

下圍棋,計算機最大的優勢就是計算能力超乎想象地強!如果計算能力足夠強,一開一關的二進位制運算決定了它每走一步都可以知道這一步後面所有的結局,意味著它知道必贏必輸的所有落子點!人腦呢?

由於無論如何做不到這一點,所以只有通過布局造勢使自己必贏的概率提高!但相對於計算機,高下立判!可是,按照人類目前的認知,計算機的計算能力還能更強,人腦卻只能布局更強,從這個角度看,我覺得只要計算機計算能力足夠強,圍棋象棋西洋棋等人類肯定不是對手!

但是像撲克麻將等,每一次的判斷都不可能必定正確,計算機的計算能力再強也不可能預知必贏必輸的打法,與人類對戰的時候,勝負就不好說了!

5樓:包季真

不談投入產出比怎麼比勝負?

從功率的角度來說,人類棋手在下棋過程中,大腦功率也就100瓦上下。

但是AlphaGo呢?下面有張圖,是AlphaGo測試中,AlphaGo多次使用不同數目的CPU和GPU,以單機或分布式模式執行。每一步棋有兩秒的思考時間。

最終Elo等級分如下表:(3000分的Elo等級分差不多可以戰勝人類)。

按乙個CPU50瓦,乙個GPU100瓦算,要超過3000分的Elo等級分,要包含764個CPU和112個GPU,也就是超過50千瓦。但是這只是CPU和GPU,你再算上匯流排、散熱。。。百千瓦級別。

好吧,1000個人的團隊打乙個人。。。

6樓:張申

從目前alphaGo的原理來看,因為沒有窮盡所有行棋的步驟,所以價值分析時採用高概率落子與隨機落子聯合的方法進行預判。這種落子方法必定會漏過很多種落子可能,所以預判也會漏掉對這些落子的分析。

當關鍵的勝負手沒有出現在alphaGo預判的落子範圍內時,alphaGo的判斷就會出現失誤。

如果中腹出現大龍對殺,而通過連續手筋可以殺掉中腹大龍的棋alphaGo很大概率會分析不出來。因為通過連續手筋贏棋要求連續每一步都是正確唯一解,下錯一步都會輸,所以在alphaGo的分析價值觀裡,這是小概率贏棋方式,而alphaGo只會選擇大概率贏棋方式的棋。

如果alphaGo在大龍死活問題上判斷失誤,會導致其全域性形式判斷失誤。

7樓:

目前的人工智慧只是處在弱人工智慧階段,即沒有自主意識的人工智慧,它需要人為的設定路線讓它行動,個人不認為阿法狗憑藉精妙的棋藝戰勝了李世石,李世石輸在他的大腦容量無法裝下世界上所有的圍棋資料。人工智慧對應急策略情況下做出的反應就可以看出,它是弱人工智慧,它只能按照判斷好的落子點進行分析,走出概率最大的那一步。

窮則思變,人類之所以強大,正是因為人是生物,擁有思考的能力,而人工智慧明顯缺乏這點

8樓:「已登出」

從沒看過人機大戰,不光是因為我的圍棋很業餘,業餘到二十幾年沒碰了,更大的原因是源自對所謂人工智慧的理解,對所謂的人機大戰完全不感興趣。

以我的看法,只要人類還沒滅亡,所謂人機大戰的主動權永遠在人的手裡。

為什麼有前一句?最近不遠的時間內,霍金,馬斯克等大咖剛發表過對人工智慧的憂慮,如果AI真的真的真的產生了(理解嗎?現在根本沒有真正的人工智慧……),人類或許在瞬間就滅亡了。

以下是我自己的理解:所謂智慧型,只是乙個極大的儲存器+乙個極大的處理器+乙個隨機處理的功能訊號。遇到某個問題,處理器根據儲存器中的資料,挑選乙個「感覺」正確的隨機的處理訊號。

僅此而已。

而現如今的任何機器,任何人工智慧,都是沒有這個「感覺」的,它做出的決定,是人類預先設定好的,人類「感覺」的最佳的選擇。

所以,所謂阿爾法狗戰勝李世乭,只不過是阿爾法狗儲存器裡面的棋譜難倒了李世乭。換言之,只是李世乭作為人類的儲存器無法達到電腦儲存器的容量,導致處理器給出了錯誤的選擇,戰勝了李世乭的永遠是他自己。

如果哪天人工智慧真的有「感覺」了,假如他的儲存器還不夠強大,或許和人類也是有勝有負;如果已經足夠強大,你覺得人工智慧只會「感覺」和人下圍棋比較好玩嗎?呵呵

跑個題:悲觀的說我覺得人類終將被人工智慧滅亡,如果哪一天「電腦」的資訊儲存量和處理能力達到質變的邊緣,或許會產生乙個隨機的訊號,也就是我說的「感覺」,這個「感覺」如果對了,就是滅亡人類,從此進入乙個人工智慧大一統的階段,或許人工智慧成為「神」之類的存在;如果「感覺」錯了,人類同樣滅亡,人工智慧也因錯誤而失去生存的根本,從此消失……

9樓:無痕

其實很簡單,李世石下了一手棋剛好觸發了乙個bug導致集群癱瘓。機器學習的原理是不斷擬合,而擬合需要時間,就算擬合好了還需要放到集群上去預熱。這些需要兩到三天的時間,不是一次機器重啟能夠解決的。

所以78手之後你可以看到go的狀態下降了不少。這應該是由於沒有預熱,或者一部分train結果丟失導致的。

前面的高票答案都在宣揚人類如何戰勝了機器,我覺得還是要理性一點吧。就算go贏了就代表機器的智慧型勝過人類了?擬合不代表智慧型,人類連基本的智慧型是什麼都解釋不了,根本無法製造出人工智慧的機器。

10樓:

李世石OS:

第一次,有了旗鼓相當的對手還得到了一生的摯友兩份喜悅相互重疊這雙重的喜悅又帶來了更多更多的喜悅本應已經得到了夢幻一般的幸福時光然而,為什麼,會變成這樣

是我,是我先,明明都是我先來的……圍棋也好,上段位也好,還是稱霸棋壇也好

為什麼你會這麼熟練啊!你和柯潔下過多少次了啊!?你到底要把我甩開多遠你才甘心啊!?

如何看待李世石VS阿爾法圍棋人機大戰第四局李世石第78手的 神之一手 ?

樂紗 AlphaGo,乙個批著鋼鐵鎧甲的 紙老虎 我個人猜想它的致命弱點如下 長步驟的精確計算有問題。它在若干步以後無法精確計算。這就造成第四局中,大範圍對殺 若干塊對殺 長步驟對殺中出現漏算。漏算之後,它在自我評估勝率低於50 的情況下的選點仍然選擇勝率最高的,但是這時候的勝率可能受大量的低等級棋...

如何看待世界首屆星際爭霸人機大戰職業選手stork4 0完爆人工智慧?

梅羅紋嘉 發現乙個奇怪的事,對這個問題的回答有乙個套路 1.星際比圍棋複雜 2.星際balabala 怎麼沒人分析圍棋怎麼怎麼樣啊? 孫林可 由此可以引發出乙個問題 星際爭霸能否在AI發展後期進行 具有意義的 遊戲。如果4D真的是最強戰術,並且AI可以用4D打敗人類,請問是否要繼續研究。如果我沒記錯...

如何看待最強大腦人機大戰中,王峰輸給小度?

狂雀 挺好的 感覺這個人表面看起來很謙遜,實際內裡十分囂張一天到晚什麼國際標準要求這個要求那個的 輸了很正常 反正不喜歡這個人 薑水桃 王峰是世界記憶冠軍,以擅長記憶著稱。但是因為節目的各種原因,這場比賽沒有讓名人堂裡擅長人臉識別的大神出馬,於是王峰做了替死鬼。ps 王峰對戰小度是2 3 水哥和小度...