AlphaGo 有沒有 棋風 ?它在下棋時會犯錯嗎?

時間 2021-05-11 11:54:06

1樓:棋道通天

有啊,至少AlphaGoLee版本的棋風和人類棋手一樣明顯。

人工智慧和普通計算機不一樣,圍棋也和西洋棋不一樣。

可以這樣比喻一下:人工智慧計算5000次,其中可能3000次都是有效計算。而普通計算機計算50000次,其中可能有30000次都是完全不符合棋理的瞎走,剩下20000次裡,有效運算也不會超過2000次。

然而好多人工智慧的資料庫都是用超級計算機運算的。

圍棋中大局觀非常重要!廣義的大局觀包括計算思考創新在內的很多能力,但狹義的大局觀可以理解為在不需要計算的時候,憑感覺落子的能力。

可能是因為人類在大多數人機對局中都沒有把AlphaGo的運算能力逼到極限,所以看人機對局棋譜經常感覺AlphaGo的大局觀比它的計算還要強,它是有自己的「想法」和棋理的。

2樓:Jessica

這個問題很明顯沒有理解阿法狗執行的演算法原理。

阿法狗只是在驗證研發者所構建網路的精度而已。

深度學習網路

題主可以去了解以下深度學習網路的輸入與輸出機制,你就會明白,阿法狗的一切行為,都是基於訓練集的資料內容而形成的,這個網路容量越大,他的下法收益就會越高,這種行為僅僅是這一網路訓練結果的體現而已。

而所謂棋風,我傾向於認為它可以擁有人類視角判定的一切棋風,任何棋風只要有收益,都是可能為阿法狗所採用的。

3樓:暖筆刀

「無忌,我教你的還記得多少?」「回太師傅,我只記得一大半」

「 那,現在呢?」「已經剩下一小半了」

「那,現在呢?」「我已經把所有的全忘記了!」

「好,你可以上了…」

這就是無招勝有招,乙個沒有自己固定風格,沒有固定套路的對手才是最可怕的。

4樓:王曉東

所謂的「棋風」,應該理解成個人自身對圍棋的理解侷限所帶來的行為手法限制或者偏好。很顯然就阿爾法狗的運算能力來說,它不需要棋風!

5樓:九條瑞穗

1。有。他的棋風是穩。簡單地說就是能贏。贏多贏少不重要。

2。會犯錯。經典一幕就是李世石第四場。李世石下完後阿法狗下了乙個很奇妙的應對最終滿盤皆輸。普遍認為是李世石那一手下在了當時阿法狗的盲點上。

6樓:小青蛙

《大劍》裡面所有角色都根據自己的戰鬥特點有乙個符合的稱號,但是只有no.1是沒有的,因為人家無論是速度、力量、敏捷等種種都比你們強,所以只能叫「微笑的泰蕾莎」,因為特點只有微笑這一點了

7樓:

問它會不會犯錯,答案是顯然的。圍棋最優策略是超高複雜度的NP難問題,alphago找到的解不是博弈論意義下的最優(必勝)策略。

問alphago會不會犯錯,就如同問(同樣快過人類)的法拉利能否超越光速。

8樓:

我倒覺得Master可以算是有棋風。

即使不說是棋風,至少也算是行棋有一定的規律性。這一點上柯潔在第二局的時候也說了,即Master在優勢的情況下會行棋穩健,喜歡主動消劫簡明局勢。而在第二局Master有一處劫爭一直撐著沒補,說明Master判斷此時局勢不是特別好。

至於下棋時是不是會犯錯,還是有兩點可能性。

第一點可能是,通過機器學習得到的網路和實際情況有出入。

這一點上即使有錯,通過這麼多場對局下來,只能說人類也很難抓住這樣一種錯誤。

第二點就是劣勢局下的「奇怪」表現。

這一點不一定是乙個錯誤,但至少在對人類選手時事實上可能降低勝率。不過這點上和原理有關,Master假想中的對手是另乙個Master,對方在棋局的計算上與自己是處於同乙個水平,而且不會打勺子。而對人類時人類可能會算錯,因此即使劣勢,如果走得更穩一些,說不定對手會出錯。

對於這點,如果能讓Master從某些棋局的中段開始接手,代替落後一方,可能更加能看出一些東西。

至於優勢情況下收官沒收到最大目數,個人認為從目前來看不算是乙個錯誤,我覺得Master這麼收是已經算清了。

9樓:EdenToT

其實,如果是輸贏的話,人類也許無法戰勝機械人,但是仔細想想,圍棋這麼悠久的歷史,真的只是輸贏嗎?別人我不知道,我圍棋水平也沒有很高,但是下棋會使我快樂,和不一樣性格的人下棋,體會是不同的,性格暴烈的人下棋也會跟重視進攻,性格謹慎的人可能更喜歡防守,,,就是這些不同才讓每一局棋都更有樂趣,輸贏只是一方面,柯潔只是乙個97年的熱愛圍棋的年輕人,這樣以輸贏去評判他是不是太殘忍,圍棋難道不應該是一種心境嗎?

10樓:

畢竟沒有感情,所以alphago是最專注於精確和勝率的旗手。

也是因為沒有人類的情感和精神,所以才能做出「20投,不給就送」的舉動。

詳情看2v2那場

11樓:Albatross

AlphaGo是通過那麼多把對局來創造出的演算法來進行對弈的,因而可以說是沒有棋風的。而且和人相比它也沒有人類的情緒波動,在和人的對弈當中不會被環境干擾。

所以說,99%的可能人類會輸給AlphaGo,因為我們是人類,但那1%的可能人類會戰勝它,也因為我們是人類,因為我們有自己的思想。

12樓:

正合奇勝,大局很準,行棋十分穩健,奇勝方面善用造劫,但基本是靠一條大龍連全域性的思路。

缺點是收官,區域性稍微短路,不擅長區域性控制,實際上還是靠大龍相連的思路。

13樓:

(不懂圍棋也不懂ai的答主又強答了)

如果說"棋風"指的是覺得什麼樣的招式厲害的話,alpha go當然有"棋風",就是它的估值函式。

只不過人類的棋風可以用一句話說明的話,alpha go的"棋風"可能就是一本書,但是可能其中哪句話人類都看不懂,並且撕掉一頁可能它就不會下棋了。

有些答主也說了,計算能力越強的話,你越看不出它的棋風。它參考了幾十步以後的成千上萬種變化裡選擇了對自己最好的一步,它對這些變化的判斷和偏好是很難體現在這一步裡的。

只有完全按估值函式來下才可能看出它的"棋風",不過人類想用幾句話就概括人家的一本(天)書,應該還是很困難的。

14樓:蕭邦

因為運算能力不足所以只能在侷限選擇下取最優解,這種選擇是收斂的,是運算能力侷限導致的選擇路徑依賴,這就是棋風。阿爾法狗也受運算能力限制,它的最優解選擇也是收斂的,所以它有棋風。

犯錯的實質是沒有取到最優解,因為阿爾法狗運算能力不足必定存在無法取完所有的最優解,所以它會犯錯。

15樓:胡耀宇

圍棋博大精深,千變萬化。其每一步棋的好壞不是絕對,而是相對的。同樣一局棋,由於每個人的性格不同,閱歷不同,眼界不同,看待棋局的角度是不一樣的,理解棋局的意思也是不一樣的。

下出來的棋自然也不一樣。下圍棋,最能體現乙個人的性格,所謂「棋如其人」,就是這個道理。

因此,性格穩重的人行棋也穩重,性格衝動的人,行棋也衝動。到底哪種性格好,這卻很難說,性格穩重的人的確可以少出錯,但是很多時候容易考慮過多而延誤戰機;性格衝動的人則決斷迅速,把握戰機能力很強,可是很多時候由於欠缺考慮而容易犯錯誤。所謂「棋風」,就是指:

「每個人將其獨特的個性融入進圍棋,從而在棋盤上形成一種自己獨有的風格。」 老射鵰主題曲裡有這麼一句歌詞:「論武功,俗世中不知哪個高,或者,絕招同途異路」。

說的就是這個意思。

阿爾法狗不是乙個活生生的人,它只是一台冰冷的機器,它遵循人類賦予它的指令:「贏棋」,因此它所有的思路都是跟贏棋有關。它的眼裡只有每一步棋贏的概率有多大?所以它是沒有棋風的。

它在下棋時會不會犯錯這個問題很難說,要看從什麼角度來看了,如果從我們的角度來看,由於樣本太少,目前它的錯誤很難被我們發現。但是若從絕對的好壞來看,它的錯誤會很多,因為它每一步棋不是基於最優解來思考,而是基於概率和大資料來思考的:「這步棋未必是最佳的一手,但卻是此局面下大資料顯示贏棋概率最大的一手!

」 那你說它是犯錯了還是沒犯錯?

今天聽說新版的阿爾法狗可以讓去年舊版的阿爾法狗三子,這一點我倒是不驚訝。阿爾法狗應該是有破綻的,只不過由於樣本太少,我們很難發現。但它們自己對弈,樣本就可能會很多,一旦舊版阿爾法狗被發現破綻,它又不像人類那樣可以利用心靈的能動心及時調整,很容易越下越慘的。

但是,這不代表新版的阿爾法狗也可以讓人類頂尖棋手三子!讓人類頂尖棋手三子,就好比讓巴薩足球隊四個人(不是四個球而是四個人),這是無法想象的!我覺得只有圍棋之神才有可能讓人類頂尖棋手三子,阿爾法狗雖然實力很強,但它離圍棋之神還是相差甚遠!

所以它絕對不可能讓得了人類頂尖棋手三子!這與新版阿爾法狗讓舊版阿爾法狗三子這件事,沒有模擬性。

16樓:

剛看完柯潔對AlphaGo第一局,有感而發

從昨天柯潔的布局看,明顯是前一段時間已經在練對付AlphaGo的招數,三.三開局是其一,小目大飛守角早已有之,但是明顯是AlphaGo-Master帶起的一波熱潮,第7手更是學習Master招數,向AlphaGo致敬,看到這裡有經驗的棋迷都猜到柯潔這一局的策略很可能是先撈後洗。

這樣的針對性策略,高手之間的比賽,特別是番棋中很常見。

問題是,這樣不自然,過於執著於執行既定策略,經常會盲目地忽略了旁觀者輕易看到的更優選擇。

AlphaGo從來不會固執於構建模樣或搶占實地,最注重全域性配合、充分發揮所有棋子的效力,這才是自然,按吳老先生的說法,這才是道。

第一局,白30手一出,恐怕就注定了柯潔不能死守先撈後洗的策略,結果是白棋掏掉了黑棋的左上角,黑棋在左邊獲得了外勢。後來仔細品一品,左邊那4個白子半死不活,白48,50,54這三手相關的手段充分地利用了4個白子的味道、利用了黑子氣緊的弱點,已經有人進行了手割分析,左上角很可能是白棋得分。

我希望柯潔後面兩局不要用既定的策略縛住了自己的手腳,這樣其實不利於發揮出最佳水平。AlphaGo是沒有感情的,不會為任何策略所動。

17樓:黃江樓

一點拙見。

我的理解是,「棋風」是棋手比較偏好的下棋路數。

對應於機器學習,可能就是 preference bias,即對於某些模型和解法有特定的偏好,這正好是機器學習過程要避免的。

為了更好的泛化,設計 alpha-go 的演算法的時候就不會特別傾向於某種下法或者「棋風」。這可能也是為什麼上次對陣李世石的時候,deep mind 說他們不會針對打劫做特別的處理。

18樓:夏飛

總結了一下AlphaGo的核心演算法,剛好一頁紙:

One-Page AlphaGo -- 10分鐘看懂AlphaGo的核心演算法

其實AlphaGo的基本原理並不很複雜,理解了背後的邏輯,這個問題自然就懂了.

有沒有簡單易做的菜,給在下推薦一波?

大湖股份 來嘗試一次大湖的 鴻運剁椒鱅魚頭 1 解凍魚頭 裝盤鋪好剁椒,倒入調味汁 2 大火蒸15分鐘 3 澆上熱油 撒上蔥花就可以大快朵頤享受美食啦!簡單三步 回味無窮! 冰藍兒 番茄炒蛋,青椒肉絲,酸辣土豆絲,涼拌黃瓜,絲瓜炒蛋,炒青菜,西葫蘆炒雞蛋,清炒西葫蘆,胡蘿蔔炒雞蛋,土豆肉片,涼拌西紅...

背馳後有沒有可能在下面形成新的中樞?

明天的明天是後天 存在這種現象,那是因為沒有正確理解 沒有趨勢沒有背馳 這句話,把背馳判斷錯了。纏論原文中講的很模糊,而且有點亂,需要自己多思考,剔除干擾項,再把有用的資訊整合。 當然可能,纏說的至少有兩個不是只能有兩個。1.有乙個中樞背馳叫盤背。2.至少有兩個中樞形成的背馳叫做趨勢背馳。兩個以後,...

用衛生棉條的小姐姐有沒有覺得那根線在下面摩擦摩擦的很奇怪?

Ezarc 我也是!有什麼解決方案嗎嗚嗚嗚嗚嗚嗚 更新 我狠狠心把棉條推深了一點,然後就沒有那種磨的感覺了,應該不是線的問題,還是棉條推淺了停在了感覺區域。有類似困擾又還想繼續用棉條的小姐姐們可以試一下這個。我現在可以很順利地使用棉條啦!棉條比衛生巾真的乾爽很多!快樂 昨天第一次使用我也是這樣,尤其...