如何看待 DeepMind 要挑戰星際爭霸 2 ?

時間 2021-05-09 20:44:03

1樓:233

個人認為不要扯什麼「星際爭霸,難道有人會認為狀態量會比圍棋的10的170次方更多?」「AlphaGo不需要理解什麼戰術、兵種克制問題,這種具備自我學習能力的AI和業餘愛好者輸入特定策略的AI根本不可同日而語。」等等話。

星際爭霸與圍棋最大的不同點就在於戰爭迷霧的有無。圍棋兩個人都看的清整個棋盤,而星際爭霸的視野受到限制,如果沒有視野你怎麼來利用勝率設定它的行動?所以它不可能做到完全的克制。

總不可能給它來乙個視野全開?那就根本不是公平競爭了好嗎?

當然如果研究人員能克服戰爭迷霧這一問題估計離戰勝職業選手也就不遠了……

2樓:周磊

3樓:吳鋒鋒

我就說一句千萬不能讓電腦玩神族。打運營電腦肯定操作爆燈(蟲族前期需要很多微操,電腦的決策也可能會失誤,畢竟開局就那麼幾條蟲……)

要是AI神族拖到後期了,那幾個巨象+太空部隊咋打……

4樓:「已登出」

可能做出個新手級勉強能用的ai都要好多年

先說一下,星際的ai介面已經做出來了,功能不過是獲取畫面、提供鍵盤滑鼠的輸入介面,ai和人類獲得的資訊沒有什麼不同,apm也是有限制的,說操作無敵的可以歇一歇

再說為什麼難。如果和其他已經被其征服的遊戲一樣,alphasc也是只認識原始畫素的話,估計連基本的「單位」「血條」「攻擊」「停火」「技能釋放」「採礦」「收入」這些基本概念都要學習很久,最困難的正是如何在短時間內讓ai形成類似的概念。很多人所說的基於兵力對比,視野控制,偵查等的ai規則實際上仍然屬於傳統ai的思路,不符合alphasc的原理,繞過了最困難的部分。

如果deepmind人為把各種單位的操作先做成乙個基本的操作集,確實可以加快alhpasc初期隨機操作效率低下的問題。但是這本身也是乙個難度不小的工作。首先最基本的影象識別就很難搞定,因為每個單位都有不同的姿態和血條,會被遮擋,而且還要通過移動鏡頭找到包含目標單位的影象。

為了滿足實時性,效率還不能太差,其實已經超出了一般意義上影象識別的範圍。

即使做成了,星際的對局狀態也比圍棋大了不知道多少倍,演算法肯定不能完全沿用目前下圍棋的演算法,必須進行更多的優化。而且由於電競遊戲的補丁非常頻繁,特定版本的高質量rep數量其實很有限。採用目前alphago那樣,利用現成rep做預訓練的方式應該是行不通的。

不知道暴雪會不會做出個專供ai研究,只改bug不改數值的星際版本。

不過雖然比起圍棋困難的多,星際2更接近現實中人類遇到的問題情景,如果這個被deepmind團隊解決了,那麼離人工智慧全面造福人類真的是前進了一大步。

5樓:綾波麗

說圍棋比星際難的,要麼是沒下遊戲的,要麼是不寫程式的。就複雜度來說,星際的複雜度遠超過圍棋。只是人類到達的水平不高而已。

6樓:阿梅

隨便說點,圍棋略懂,很菜,星際略懂,很菜,AI略懂,很菜。

我問一下,你們確定狗他不會開局宕機嗎=_=都說圍棋可能性多,明顯星際更多好吧,對於人類來說,多出乙個火兵或者乙個叉叉沒什麼區別,對於AI來說,多乙個兵對他來說就是多了無數種未來的可能性了。狗下圍棋的時候也是靠計算哪個點位勝率高之類的來慢慢佔據優勢,難道在星際就完全換了?星際多乙個兵對於狗來說就完全是兩個遊戲了吧,人類的話嗎…………A過去啊,不要怕

7樓:二師兄

在回答這個問題之前,不談是否了解阿爾法Go,先得能回答乙個問題,之前大家都認為計算機在圍棋上不能戰勝人類,為什麼結果他們判斷錯了。

8樓:釔硫化碳

看看AlphaGo的名字

Alpha 阿爾法 Go 圍棋

AlphaGo 翻譯應該是阿爾法圍棋。。。

有點好奇為什麼乙個下圍棋的軟體要去打SC

那不是應該改個名叫AlphaSC嗎

9樓:Suta.fy

如果兩邊經濟五五開的時候在電腦的操作下,人基本是打不過電腦的……AlphaGo如果做好前期防守,經濟哪怕46開中期一波200人口的決戰很可能會讓人直接血崩……而這邊我覺得最有可能打敗AlphaGo的是在兵種配置,戰術迷惑方面,只要騙過了電腦還是很有希望的。

10樓:雪域寒風

我想知道啥時候來打wow,開個奧山,人類這邊40個人類獸王獵,給他40個屌絲戰。40發彈幕就能讓他全掛了,還和我講技術和操作,還講戰術?啥叫獵爹知道嗎?

11樓:True囧rzFalse

覺得星際ai實現困難的,請先試著了解什麼是阿法狗的估值網路,星際中對自身實力當前的判斷標準是很明確的,按不同單位的權重,以及時間線推進的應有估值進行比對即可。其次,走子網路就相當於對戰術的選擇,所謂戰爭迷霧也就可以看成圍棋盤上未走子的區域性。這些資料都是可以量化的,對於狗來說是很容易處理的。

至於演算法深度的窮盡,星際的現有職業選手的戰術組合深度上是遠不及圍棋深度的。

12樓:陸沉

很多答案都忽略了乙個重要的前提。

"知道"

如果為了公平起見,AlphaGo 不允許使用 SC2 API,不允許直接從引擎拿資料。那麼請問他如何知道螢幕上那堆五顏六色的色塊裡,哪個是機槍,哪個是毒爆?怎麼知道哪個挨打,怎麼判斷哪個血少?

還要在毫秒時間內做出判斷,沒那麼簡單的。

這可不是圍棋。

13樓:

看到很多玩家說這個遊戲是資訊不對稱的,我只能說,在電腦面前,我們都是瞎子好麼你一盤遊戲開始,前幾分鐘能出多少資源,這些資源能夠生產多少單位都是極為有限的,也就是說是可以算清的。在前幾分鐘,電腦可以在與人類相遇的瞬間算清人類所有可能的排列組合,然後就能知道你所有的底細。電腦還能夠記住你死了多少兵,剩餘多少資源,進一步推斷你當下剩餘多少兵,有哪些兵種,剩餘的資源會如何利用,人總會浪費的,而電腦會完美利用每一分醫資源。

而且對人類的情況瞭如指掌。而人類對此毫無察覺因為星際二說白了就是乙個資源採集效率問題和資源分配的問題。0由於遊戲設定了不同的兵種和建築,種族,那就存在著不平衡,所以必定存在乙個最優解。

策略這種東西只適合用於人類,不適合用於ai。圍棋比賽我全程圍觀,電腦經常會下人類絕對想不到的一步。圍棋經過千年發展尚且被電腦看出破綻。

星際二才短短數年,期間還有無數版本更迭。當你們還遠遠沒有探索出乙個版本的完美解前,卻因為乙個補丁而不得不去探索下乙個版本,所以你們永遠沒法把遊戲玩到最深入(不信你們把這個版本再玩十年,你就會發現你們的戰術其實是十分幼稚的,但版本更迭,你們沒有那個時間) 。而且你們的戰術看似多,但真正可以稱得上是優秀的策略根本屈指可數。

因為你們的很多策略是針對人類而作出來的,譬如一些奇襲的或者一些陷阱。人類在面臨突然的變化時來不及做出正確的判斷,所以導致失敗,這是所謂的出奇制勝,攻擊的是人的弱點——情緒,電腦沒有情緒。電腦靠電流來傳遞資訊,而人類永遠都受困於0.

01秒的神經反應速度。人類瞬間反應比電腦更快?確實,但那是因為人腦看到畫面後會輸入更多更複雜但是跟遊戲勝負無關的資訊,譬如想象力這種東西,會大量占領大腦cpu。

而對於只對遊戲勝負相關的資訊,人腦不可能比電腦快,因為人總是被不斷干擾。人家沒有勝算。

14樓:我行我上

先說觀點:這不是乙個好問題,題主略坑。

那麼答案應該是:AI多數情況下會勝出。

首先噴各位答主:

人類和AI各有特點,回答這個問題無需做沒有意義的假設。

這個問題的答案應該是:AI多數情況下會勝出。

理由如下:

RTS遊戲勝負由兩個元素決定:策略+操作

對陣中,如果有一方選手能做到其中乙個元素和對手打平,另乙個元素佔優,則必勝。

那麼我們看下乙個AI能不能做到呢?

1.操作不用說,AI必定完勝。

2.策略部分,爭議較大,說說我的觀點。

所有的RTS遊戲都包含的元素是:兵種相剋。

所以才衍生出許多精彩的「偵查——反偵察」的對戰局面。

當遭遇資訊欺騙導致決策錯誤時,幾乎必輸。

那麼AI能否做到,不被玩家資訊欺騙呢?答案是能。

理由如下:

RTS遊戲為了照顧遊戲體驗,一般不會出現開局短時間之內一方完爆另一方的局面。

偶爾出現的各種RUSH之類的,都有各種方法來克制。

「偵查——反偵察」這個關鍵環節,一般出現在遊戲中期,雙方有幾次衝突之後。

而在這些衝突中,AI的操作可以獲得更小的戰損比,從而通過多餘的單位(或節省下的資源)來實現遠比人類選手完善的資訊偵查。

這裡解釋下AI能做到什麼程度:

APM8000+ 100小狗強衝下20坦克陣

100小狗強衝20坦克陣,最後剩下19小狗。這點沒有任何人類玩家能做到。別說剩下19只,就是剩下1只都做不到。

這種AI和人類的對陣,兵種構成越複雜、數量越多對人類越不利。(後期人類必輸)

這麼看來,或許人類玩家的勝機在於前期或者中期。

但很不幸的是,RTS的前期永遠對防守方有利。(因為地圖較大,防守方兵力密度佔優)

看中期:

如果前期人類不進攻,把部分資源用在防守反偵察上。

如果防守單位足夠強力,讓AI付出相當大的兵力(比如30%)都偵查不到敵情,然後人類一窩蜂的出來RUSH,運氣好的話,人類就贏了

但沒有遊戲會這麼設計,為什麼呢?

因為這樣所有的玩家都會變成烏龜流,這個遊戲就沒有樂趣了。

(基於這個原因,暴雪設計SCII中,在中後期防守單位價效比極低,設計師是鼓勵進攻的!)

綜上,AI贏面佔9成往上,人類在這個領域就是渣渣。

最後噴題主:

你所指的答案明顯是乙個錯誤答案。為什麼呢?

該答案中指出:正常情況下不可能知道坦克要攻擊哪乙隻狗。

但事實是,坦克攻擊步驟是這樣的:

炮塔指向(瞄準)→前搖→攻擊→後搖

在後搖之後的攻擊CD期間,坦克可以指向下一次攻擊的目標。

也就是說:正常情況下,AI通過觀察坦克炮塔的指向就可計算出坦克要攻擊哪乙隻狗。

AI可以在坦克一次攻擊之後的CD期間和前搖期間來操作小狗躲開坦克的濺射傷害。

如何看待DeepMind再次挑戰星際爭霸專案?

柴小軼 剛剛看完,按照和MaNa的五場比賽,似乎在操作和初期運營上的區域性優化優於人類,在交戰選擇上也很強,但是在大局上還是略有差距。MaNa現場的那場更加確定了這點。但是同時AlphaStar也展現出了可以雙線的潛力。考慮到還有快1個月時間,我在這裡猜測Serral面對的將是可以抵禦多線進攻的更強...

如何看待Deepmind將研發能玩《毀滅戰士1》的AI?

Naiyan Wang 說好的要來更新,拖延症了下 先來分享下我上週組會的slides Naiyan Wang Miscellaneous。幾點insight我願意在這裡再重複一遍 1.我個人理解這個文章的本質在於一套end to end learning的框架,通過CNN對原始高維的輸入影象進行自...

如何評價 DeepMind 最新成果 Alpha Star 的表現?

賢魚 瀉藥。昨晚看錄影看到對mana的第二場,按照老仙的說法或者我的理解是alphastar在摩擦了tlo這個凱子後過 學習 了兩周才來打的mana。這其中的進步肯定是毋庸置疑的,甚至是快到了一種令人髮指的地步。第一局不偵查不堵口,建築學也是一塌糊塗,講道理自爆球炸自己這種操作我上我行 然而當對陣m...