AlphaGo 在和李世石的第四局比賽中失敗,是因為 AlphaGo 出了 bug?

時間 2021-06-02 10:23:38

1樓:alpha WTF

AlphaGo輸掉這盤讓人鬆了一口氣同時也看到了人工智慧接下來改進的方向。對人工智慧的發展來說是好事。

在現在這個階段,如果暴露不出AlphaGo的任何缺點,讓所有人和開發者都處在盲信當中,反而是很可怕的。目前能看到,隨機演算法還是需要更完善的評估機制。

所以,李世石上盤所說的 「個人的失敗、不是人類的失敗」就很對了。李世石個人贏回一盤,人類開發的人工智慧也更能夠繼續進步。

人工智慧在很多領域替代人類的可能性也在繼續增加。

2樓:羅伯特

無非是三種可能。

一是李世石放下包袱,無牽無掛,發揮出最強戰力,也就是那所謂神之一手。

二是阿爾法狗確有破綻,前幾盤李世石並沒有察覺到。可能是通過前三盤的總結,也可能是第四盤另闢蹊徑,李世石終於找到阿爾法狗的破綻並加以克制。

三是阿爾法狗故意放水,反正已無關大局了。

3樓:

估計是李世石第78手「神之一手」擺出的棋型在歷史上(有一定的水平的棋局中)極其罕見,導致 Value Net 評估局面失誤所以在誤以為自己勝率高於李世石的情況下下出了幾手(它認為是無傷大雅實則致命的)緩手;如果真是這樣的話還是乙個樣本量的問題,而且屬於中盤不能用 AB 搜尋強行求解,估計 DM 的人要頭疼了。

4樓:

這個問題主要是演算法導致的,並不算bug。

關鍵問題出在AlphaGO的隨機演算法上。AlphaGO的走子模式大概相當於3段的水平,而評價勝率用的幾乎是隨機走子的方法,二者各佔50%權重。

首先,AlphaGO的棋風求穩的原因就是在隨機走子的對弈模式下,越穩的招數勝率越強。很可能有一步是妙手,有很多很好的變化。然而留出來的變化直接被隨機走子填掉了,反而是一大塊損失;而求穩的話隨便你怎麼下,勝率都是穩定的。

這個前提體現在盤面上,就是AlphaGO避免打劫的原因——打劫算的後幾步根本沒法用隨機走子體現出來,所以贏面非常不穩定,在勝率評價中根本不佔優勢。

體現在第二盤的征子和這盤的「bug」裡,就是:在隨機走子評價模式中,只要長出來有兩三口氣,就會進入隨機演算法的評價範圍內,儘管任何水平的棋手都能吃掉這塊大棋,隨機走子要把這塊兩三口氣的大棋走死卻很有難度。

所以AlphaGO前期的深遠布局和盤中的各種bug,其實都是隨機演算法的評價模式導致的必然結果。

於是在這裡幾乎能夠判斷李世石贏下第五盤幾乎沒有懸念了……臨場改程式根本是不可能的事情,而再多的訓練也沒有辦法改正演算法的本質。甚至李世石第五盤照搬這一盤,AlphaGO還會是同樣的應法——AlphaGO的隨機演算法每一步有幾千盤,即使有隨機性,在蒙特卡洛演算法的多次重複下,每一步的結果並不會有太多的差異。

如果要提公升的話,走子模式多算幾步可能就可以,然而現在的計算能力下這事兒不好做。

5樓:

機器贏了就是有不打劫的保密協議或李世石發揮失常或不配代表人類。

機器輸了就是出bug。

人類脆弱的自尊是否真的這麼廉價?

知道什麼叫勝負師嗎?

李世石和 AlphaGo 決鬥於黑白之巔,用武俠 評書和漫畫體是如何展現?

張萌萌blingbling 李世石是誰?當今第一高手!他很強?只不過比別人多練了幾年暗器!練的怎麼樣?據說還不賴!戰績呢?四十七招勝古大師!一百七十五招勝常大師!蒙著眼七十一招勝李大使!果然是第一高手!有人說他是當今的大竹英雄!但我認為他是當今的小李飛刀!他的對手是誰?阿爾法阿爾法是誰?阿爾法就是阿...

李世石與 AlphaGo 的首場對決中最開始犯的錯誤是什麼?

胖腿 李世石成了人類罪人。在阿發狗沒有成熟的2016年3月,李世石用完全愧對世界第一頭銜的實力讓阿發狗肆意碾壓。這是人類唯一最佳的時機贏過電腦 隨著時間的程序,未來擊敗電腦的概率會越來越低,而這最好的機會卻被李世石浪費了。要是柯傑或者羅洗河來,至少能在2016年維護一下人類尊嚴 未來怕是沒有這個機會...

如何看待李世石VS阿爾法圍棋人機大戰第四局李世石第78手的 神之一手 ?

樂紗 AlphaGo,乙個批著鋼鐵鎧甲的 紙老虎 我個人猜想它的致命弱點如下 長步驟的精確計算有問題。它在若干步以後無法精確計算。這就造成第四局中,大範圍對殺 若干塊對殺 長步驟對殺中出現漏算。漏算之後,它在自我評估勝率低於50 的情況下的選點仍然選擇勝率最高的,但是這時候的勝率可能受大量的低等級棋...