AlphaGoZero跟完美的圍棋之神有多大差距?

時間 2021-05-31 06:10:39

1樓:LC振盪電路

如果圍棋之神能夠完全算清AlphaGoZero的著法和選點。甚至讓9個都能大勝。圍棋之神會引誘AlphaGoZero下出敗招然後致勝。

2樓:馬閏生

想先說一下圍棋之神。

其實我認為神必須是有靈魂的,他不是乙個機器。所以他必定知道對手是乙個人或是AI。並針對他們的弱點,下出勝率最大的每一手棋。

從理論上講,作為稱職的圍棋之神,他的首要目的必定是:勝利。其次,才是追求目數最大化的勝利。所以圍棋之神下棋,追求的是最高勝率前提下,的最大目數的勝利。

既然如此,神要針對對手的弱點落子,就非常有必要。因為這也是影響勝利的關鍵因素。在必要時,神還會在棋盤上製造陷阱,威逼利誘。但前提是,對手棋力能高到棋神需要用上這些手段。

進入主題:

AlphaGoZero跟完美的圍棋之神,差距應該還很大,非常大。

這問題在於,盤棋的前半盤剛稍見雛型之時,就會分出勝負。借用並改變了一下前面一位題友的概念,在棋局對局中,有A/B/C三個選項,

在圍棋之神眼裡的勝率:A:95% B:85% C:100%

在阿法狗計算裡的勝率:A:85.1% B:85% C:--

我想表達的意思是,三個選項,神都看出差別了,但阿法狗卻有可能認為,AB兩步幾乎是一樣的勝率,而C這步最優的,甚至有可能沒算到。這種情況只要發生一次,神已經贏定了。就是說你一步也不能看漏,一步也不選錯。

但這本身也不是什麼問題,最大的問題在於,在棋局前半盤剛稍見雛型到進入中盤時,中盤到中後盤時,其中有那麼極為關鍵的幾手棋,是最難看清,最易忽略,卻又能影響深遠的準確一手。簡單說,就是棋局中的不同階段,都總有那麼幾個關鍵地方,是必須要下對的,一旦走不到,就會被對手瞬間超越。

在圍棋之神面前,你只要在任何時刻出現過一次半目的差距,那之後,你下得再好的最優的結局,就是最終輸半目。

所以AlphaGoZero,錯算漏算的次數,決定了他與圍棋之神的差距。

那麼我們可以通過觀察AlphaGoZero的自我對弈的情況,判斷他現在的能力有多接近神。在我看來,前提有那麼幾個:在設定相同的情況下,它每一局的自我對弈,都是在執某一色棋時能永遠勝出。

且無論怎麼下,下多少盤,最終的勝出的目數都應該一樣。而且勝率永遠不會中途拉開差距,永遠不會出現一方差距被拉大到認輸的情況。

如果AI有辦法做到以上的情況,那他離圍棋之神的差距,應該就小了。但很明顯這要求對AlphaGoZero來說還是太高了

3樓:jacob benseal

alphago的原理大約是這樣,對於乙個固定的棋盤布局,給出乙個子的走法,而不管之前是怎麼一步一步走到這個棋盤布局的,而不同的走法其實也包含了一些資訊,這些資訊alphago就用不到。所以還是有一些差距的...

4樓:

這個問題不是乙個數學上很rigorous的問題。你給出的圍棋之神的定義very nonrigorous。小夥子有時間多提高一下數學知識比較好。

首先在圍棋之神的定義上;按照你的問題,圍棋之神應該是指乙個演算法。那麼首先,應該限定乙個計算量,或者說限定資源的數量。對不同的資源限制,肯定有對應的不同的最優演算法。

最簡單的例子,假如現在是2023年的話,alphago zero的演算法很有可能沒有什麼意義,因為所需要的算力對當時的計算機來說很有可能不可能達到(具體我沒有調查過)。不限制資源數量的話,你這個問題完全沒有任何意義。整個可觀測宇宙的資源都不可能遍歷圍棋所有下法。

在限定資源的基礎上,圍棋之神應該定義為最優的乙個演算法。但是這個演算法存在不存在是乙個非常困難的問題。而且很難知道給定乙個演算法到底有多接近圍棋之神。

而且對於讓不同子,最優演算法是不一樣的。僅憑讓子數量來衡量演算法並沒有什麼價值。而且如果這樣乙個演算法不存在的話,那你這個問題也沒有什麼意義啊。

(我不想說你的問題是空集。)

所以不rigorous的限定這些條件的話,那這個問題就是讓人憑感覺瞎猜,猜幾個都無所謂了。比如我猜圍棋之神可以讓alphago zero 20個子。那即使簡單的證實或者證偽這個猜測就不是乙個trivial的問題啊!

5樓:凌霜雁

我覺得神可能可以讓個天羅地網……

不過前提是神知道對手是Alphago,會盡量佔便宜,使騙招。

以alphagoZero的走法,到了中盤的時候,子差就只有1了(換來勝率99%),然而,在圍棋之神的面前,alphagoZero是會犯錯的,(哪怕勝率99%都會……),在子差只有1的情況下,犯錯=輸棋。

Alphago Zero本質上不是堆算力,算無遺策,而是訓練了一種全域性棋感,看狗下的一些區域性就知道,狗對死活的理解,甚至沒能超過人類。

6樓:蘇蘭卡

個人看法跟題主一樣,讓先至讓二子之間,有生之年不知道能不能知道這個問題的答案。

我的依據是站在ai的選擇上,ai如果不出bug,大部分的招法不會虧目,小部分會虧一目,極小部分虧一目以上。一盤棋一百多手,出錯5%讓先的優勢就沒了,出錯10%讓二子的優勢就沒了。我認為目前ai的出錯機率是高於5%的(即5%的招法有更佳選擇)。

7樓:ok不提交

我認為是讓先到二子之間。

以前《圍棋天地》有個採訪,你認為圍棋之神能讓你幾個,大部分職業棋手認為是三個左右(不記得有回答超過四個的,有個南韓女棋手回答讓先,我懷疑她是不是理解錯問題了?以為問的最強人類棋手可以讓她多少)

現在柯潔和電腦打二子一勝一負吧,他微博上說了,他的看法是三子他可以贏。

所以這樣考慮,我覺得電腦和神是讓先到二子差距。

先二先?二先二?反正我覺得神讓不了電腦三個,但是讓先應該能贏。

8樓:金盃

很可能是7目以內了,因為AI對黑貼目貼多了一點點的敏感性令人吃驚,頂多多貼了1目就能讓白勝率達到80%,這說明AI對目數的控制達到了驚人的水平。

乙個大膽的猜測:頂級AI自對弈一百萬局中,就可能包含完美棋局,雙方都沒犯錯,只不過我們和AI都不知道哪一局是完美棋局。

注:這和AI在某些特定複雜局面下依然會犯大錯不矛盾

9樓:

首先,圍棋之神應該是以目數最大為目標下棋,同時對於同目數的選點,應當以分支最小為原則落子(也即變化最複雜)。

AlphaGozero面對這樣的圍棋之神,很可能會出現0的勝率,就目前AlphaGozero的自戰棋譜而言,黑白都互有勝負,說明即使是勝率較大的白方,也遠未達到必勝的程度。

同時,AlphaGozero對於讓子棋非常無力,雖然我們未能看到AlphaGozero的讓子棋,但從與其同思路建立的leelazero中可以看出,勝率網路的ai對於讓子棋的處理比較糟糕,對於讓多子的局,由於開局勝率極低會導致布局階段的落子更接近騙招。

10樓:

非常遙遠,但不意味著能讓很多子。

目前最強的9路AI尚不能達到棋神(遠超人類,但自戰仍有勝負),何況19路,難度差了多少個量級呢。

別再憧憬什麼「圍棋之神」了。

11樓:吃龍萬噸

我猜有二子的可能。

差距在於解析度。

比如序盤輪黑下某局面的兩點A和B,在棋神眼裡,是:

A黑胜12目,B黑胜13目。

而狗作出的判斷和選擇可能是:

A勝率85%,B勝率85%,下A

A勝率略大於B,下A

那麼這回合後,黑損1目。除非一局程序中有很多局面有不止乙個點導致同樣勝負結果且多數能在狗上以相似勝率表現出來,那麼在漫長的程序中狗的二子優勢就會逐漸消失,一旦消失就再沒有重獲得的可能。

何況,在可能有這樣的局面:

神眼裡:A勝12目,B負2目

狗眼裡:二者勝率都是78%下B

類似逃征子是不是成立

12樓:

那我先來定義一下圍棋之神:洞悉了圍棋所有分支所有變化,也就是在分先對局情況下,圍棋之神落子都了解形成的分支所對應的結局。

那麼我認為此時最優的下法可能就是選擇某個分支結局中,勝率最高的一手(當然有個前提,就是沒有認輸這一說,因為認輸了就相當於減少了分支),這個方法對於人神對弈來說,神一定能贏。

不過這樣有乙個自相矛盾的地方,就是當神神對弈時候,就是如果應手都是完美的話,那麼最可能的結局就是一方全敗,因為貼目可能不是公平的。如果貼目不是公平的,那麼我想這樣對弈的結果,肯定在某個步數之後,出現的分支中,由於貼目所帶來的影響,導致後續所有的分支的結局全為失敗。

那麼由此可以得到乙個啟發,我們如何利用圍棋之神獲得最佳貼目呢?那麼首先得保證兩個圍棋之神能下出一盤各自最強應對的棋局,可是矛盾出現了,之前的對圍棋之神所下的定義中涉及到的結局,是依靠現在的貼目來得到的,本來就是有偏差的。那麼還有乙個辦法,我們創造多個在不同貼目情況下的圍棋之神,那麼或許在某個貼目情況下,所有分支的結局中,黑白勝率持平,且存在平局(不是迴圈劫等特殊情況,正常收官的平局)。

選取此時貼目為最佳貼目,此時的圍棋之神為真正的圍棋之神。我們有理由相信,此時的結局只能為平局。

但是感覺如此定義的圍棋之神還是有漏洞,因為有預感,那個所謂的最強平局可能與現在人類的下法完全不同,但或許冥冥之中注定只能那麼下。

但是不論如何,拿這個圍棋之神與現在的ai進行對弈,我只能說,ai一盤都不可能贏。還有,如果假設現行貼目是不公平的,那麼我認為在這個貼目下,圍棋之神的開局勝率為100:0,如果以後ai可以訓練到開局某方棋子的勝率為100%之後,我覺得在一定程度上該ai已經接近了圍棋之神。

13樓:星聞傳播

先說結論:ai已經沒有多大的進步空間了。以下是估計:

圍棋之神讓先也不可能贏現在的alphagozero的。圍棋之神讓不動現在的柯潔或以後的排名第一的人類棋手3子,甚至有可能讓不動2子不貼目。

我們不必也把圍棋之神想得這麼厲害。畢竟圍棋的規則擺在那裡。

如果用超級計算機執行AlphaGo或Stockfish、Komodo等軟體,算力會有多強?

我19年1月時發表過圍棋上帝也讓不動agz或柯潔(當時的人類第一)3子,有生之年,拭目以待。

柯潔同學也認為不可能3子

14樓:Yuhang Liu

先抖個機靈:讓先都讓不動。因為圍棋之神知道讓先在理想應對下必敗,所以開局直接認輸。。

當然我們可以修改下「勝負」的目標。我們不要求圍棋之神給出必勝策略,我們只要求神「對當前局面給出雙方理想應對下,子差最小的選點」。也就是說假設讓先的最佳應對就是輸7目的話,我們讓神給出輸7目的走法。

這樣就能讓對局進行下去了。我猜得可能大膽一點,我覺得說不定能讓AlphaZero 3-4子,對應先手優勢可能大到30目。為什麼這麼猜呢?

16年底17年初,DeepMind黃博士曾經放出非常驚悚的訊息,他說AlphaGo master能讓和李世石下的版本 3子——但是棋譜從來沒有公開過。現有的AI說不定仍然在乙個比較低的層次。其他AI我沒聽說過超過人類後還能自我提公升3個子的,AG團隊傲嬌地宣布引退,公布的資料也比較有限,實在讓我們這些愛好者抓狂。

如何煎出完美的雞蛋?

牛頓NEO 這是乙個論如何煎出乙個完美雞蛋的哲學問題呀 小時候父母煎的雞蛋,都是把蛋黃裹在蛋白裡,煎出來的雞蛋蛋黃香嫩。我們都很愛吃,有點糖心的荷包蛋,然後兩邊的蛋白有點焦焦的。大牛想,這可能就是我們大家心目中完美的雞蛋了。其實做法很簡單呀,請參考 食材 雞蛋 調料 少許鹽,少許醬油 做法 1 不粘...

怎麼破解「完美的絕望」

十三 放眼諾大無邊的宇宙,你只不過是一粒微不足道的塵埃。宇宙眼中 人類 只是作為乙個族群存在罷了,更有甚者,宇宙只會模模糊糊記得某些星球上有某種人類。而你作為個體的存在,宇宙喘息之間可能已經在平行時空中穿梭了千萬遍。所以從巨集觀角度來看,你的存在既短暫又不重要。但是,但是。我們又確確實實獲得了這短暫...

什麼是完美的愛情?

小玲子啊啊啊 如果這段愛情剛好是你心中最美好的樣子,那它就是完美的。郎才女貌的完美,可能也會有面對柴公尺油鹽時的爭吵。貧賤夫妻,也會有相互依偎時只有彼此才懂的安全感和滿足。這是一道主觀題,而標準就在你自己心中。 bear bear 清楚自己的需求滿足你當下需求的愛情就是完美的,當然人都是會變的,當下...