如何看待 OpenAI Five 多智慧型體 在 dota2 5v5 團隊戰擊敗人類玩家?

時間 2021-05-11 14:14:56

1樓:扶餘城裡小老二

你知道n卡為什麼都暴漲嗎?

就是這幫人把最好最先進的顯示卡,買過去,做運算了。

幾千塊,上萬塊一起運算。

神經層數乾到100-200+。

他們算一場遊戲的電費,可能是我們乙個月的工資。

神經網路70年了,現在才是剛剛開始,如果用量子計算機來算的。

5打6,都沒有任何問題。

不要懷疑,趕緊過來學習一下演算法,計算機圖形學,並行運算,做人工智慧工程師,

用機器智慧型戰勝所有人,

我在想,如果人類的智慧型,達不到老虎的級別,那麼是誰的數量更多呢?呵呵。

2樓:452535

去你大爺的

n年前玩dota的時候,老子補刀補不過電腦高難和室友2個人聯機打dota,都不能選5個高難,否則一定輸!!!

我估計現在補刀也補不過電腦高難,哭。。。。

3樓:萬樂

對於學術界的人來說,可能覺得這個方案沒有什麼新意,但是對於乙個在一線從事遊戲AI開發的人來說,這個結果是非常令人鼓舞的!

原來業內的普遍看法是即時戰略類遊戲利用現有的增強學習手段還無法很好的解決,這類遊戲主要有兩個挑戰:乙個是需要同時對多個遊戲單元(比如騎士、坦克等)作出規劃(planning),導致動作空間巨大;另乙個是每乙個動作的影響都很長遠,導致遊戲的規劃深度非常的長。這使得RTS類遊戲AI的難度要遠超棋牌類的AI。

對於第乙個問題,MOBA類遊戲相對星際這樣的RTS遊戲要簡單一些,畢竟只需要控制10個英雄就可以,在這個比賽中雙方都限制能使用的英雄就更一步簡化了這個問題;

對於第二個問題,為了獲得更長的規劃深度,將reward的衰減係數γ從0.99增加到0.9997,這樣使得增強學習演算法的優化目標 能夠考慮更久之前的動作對現在的影響,原文是說從0.

5s到5min。當然這種做法也不是這裡首創,而是在Observe and Look Further這篇文章裡提出的,但是這裡並不是簡單的調整衰減係數γ就可以了的,還是需要對loss函式做一些調整才可以使用的。個人估計這種方法今後會得到更加普遍的應用。

另外這個方案還有很多任務程上的方法值得借鑑,比如對dota2動作空間的建模、Reward的設計還有團隊協作對reward的影響等等。

總之,這個方案並不是在理論上有什麼創新,它更像是kaggle上比賽的solution,對工程實現有很多指導意義。

第九藝術Wraith

4樓:張可愛

先說結論: 是乙個標誌性的事件,但算不上里程碑式的成就。因為雖然結果不錯,但並沒提出什麼新的演算法,只不過依靠極其龐大的計算資源堆疊,和一些trick。

核心演算法是2023年的PPO(Proximal Policy Optimization)演算法。

self play(自學習): 12800個GPU + 256臺GPU , 每天的計算量相當宇普通人類 180年的遊戲.

用提公升半衰期 的方法來解決 Long Horizon規劃的問題。慢慢從46s提公升到接近5分鐘。

半衰期的簡單來說就是在短期收益和長期收益之間做balance。

乙個最重要的trick是引入了team spirit 這個引數,訓練過程中漸漸從0提公升到1.

team spirit意思就是如果乙個英雄的ts =0 ,就是很自私,只為個人最優, team spirit 達到了1就是說,每個英雄都是完全無私的,只為整個團隊的勝利。

並沒有使用什麼hierarchy(層級化)的策略。

不完整資訊的問題依然是比較棘手的,所以乾脆加上不能插眼的設定???

玩過Moba類遊戲的都知道,高手和菜鳥最大的乙個區別就是對於視野的理解和控制啊。

John Schulman, Filip Wolski, Prafulla Dhariwal, Alec Radford, Oleg Klimov

(Submitted on 20 Jul 2017 (v1), last revised 28 Aug 2017 (this version, v2))

Emergent Complexity via Multi-Agent Competition

Trapit Bansal, Jakub Pachocki, Szymon Sidor, Ilya Sutskever, Igor Mordatch

(Submitted on 10 Oct 2017 (v1), last revised 14 Mar 2018 (this version, v3))

Maruan Al-Shedivat, Trapit Bansal, Yuri Burda

, Ilya Sutskever, Igor Mordatch, Pieter Abbeel

(Submitted on 10 Oct 2017 (v1), last revised 23 Feb 2018 (this version, v2))

5樓:

如果ai可以打dota,那麼可以不可以打一些戰術模擬類的遊戲?會不會通過ai,讓人類發現在真正的戰爭中沒有被認識到的新戰術?會不會很多年以後,超級計算機的ai都在解決明天如果戰爭來臨,怎麼打的問題?

6樓:雨四從

首先看英雄陣容就知道了,這五個英雄,嘖嘖嘖,操作不要太弱智,技能甩就是了,完全不需要判斷,或者說判斷的邏輯很簡單,對著英雄放嘛。

是的,判斷就是電腦AI相對與人類玩家的最大劣勢。從限制條件來看,無非就是盡量縮小電腦AI判斷的次數,然而失去了判斷的dota,可以說毫無意思了。個人認為這似乎不能體現AI的進步。

打過dota1時代AI電腦的人都知道,電腦的補刀和走位,尤其是補刀,可以說是相當犀利了,說實話,我相信隨著AI的發展,人機如果線上對壘,感覺人類方早晚要被秒成渣。電腦是可以做出完美操作的。

但還是那句話,連判斷都不用做,要你這個AI何用,從這一方面說,在dota這個遊戲上,AI想勝人還是任重道遠啊。

7樓:萬四睿

早著呢我其實很懷疑等到dota2真的已經沒有人玩的時候這個AI 能不能擺脫所有的限制和人類打一場想一想一邊也許是人類玩dota2的最後乙隻職業隊一邊是剛剛新鮮出爐的AI隊也是覺得這算是一場史詩對決了吧

8樓:大巍子

黑客帝國剛出的時候我感覺到的是震撼

現在翻出來看,感覺到的是緊迫

一切都按照乙個方向再去推這個方向就是

不斷進步的人工智慧會發展到什麼程度,什麼時候會擊穿人類想象力的空間。

遊戲上已經快了

9樓:莫煩

去看看他們的訓練硬體配置,10+萬CPU 200多GPU!就發現現在就是乙個拼硬體的時代啦。玩個遊戲不是想玩就能玩啦 (挫敗感),看看熱鬧,看看大公司秀財力就好。

10樓:午言wuyan

一開始看到ai這個基本無控脆皮陣容的時候我就想如果人類操刀諸如螞蟻tk這樣的英雄會不會基本能取勝。結果這次測試是限制頗多的映象戰。如果有錄影的話我非常想觀摩一下ai的思路,巫妖一級是幫哪路吃兵?

nec中還是毒龍中還是火槍中?到了一定等級是抱團還是分頭打錢?

甚至我都希望在不久的將來我們這些普通玩家也能參與到這種與高智慧型ai的匹配中。畢竟目前ai的邏輯實在太簡單了。

11樓:Zh Ji

從一開始阿爾法狗那時候引發的dota2AI這個事我就一直想不通乙個問題,圍棋就算了你找個人落子我覺得問題不大。

但是dota來說,人類的輸入是眼睛看顯示器,輸出是鍵鼠。那公平對抗的話,AI攝像頭識別畫面,機械臂造作鍵鼠不過分吧?這個我覺得短時間之內沒戲。

所以說什麼機器也好AI也好戰勝人類只是噱頭吧。

直接讀記憶體的話跟人類開掛區別真的大麼?

退一萬步講,這麼多限制條件,完全不能算dota2了,只是另乙個遊戲披了個dota2的殼子而已。

說公平對抗攝像頭機械臂算我抬槓,就原汁原味的dota2,我覺得一時半會兒AI贏不了。

12樓:如之岸

dota的戰略還是相對大於操作的,AI可以做到完美的操作,但是戰略上的學習還太需要時間了,不過目前的進步已經很感人了,還記得以前在major上看的bot5v5總有一隊會五個人在高地掛機不出門,已經挺好的了

13樓:

我得說一句,有的人大大低估了「不能做眼」對人類的限制,這幾乎和人類扔掉腦子光靠補補刀甩甩技能來打遊戲一樣,視野的博弈在dota2這個遊戲中關係著90%以上的決策,而光論操作和反應人類自然不能與機器抗衡。

(當然有的人也大大低估了4200分和頂級選手的差距,按照PSG.LGD.ame的說法排名一百名開外的人都是豬,4000分說不好聽點就剛剛對遊戲有了全面的了解,和5500+的選手5v5一百盤也難贏一盤)

拿AlphaGo的階段來對比,自縛手腳的人類還遠不及業6,遊戲條件的不同也決定了在dota2上機器難以發揮;熟悉dota2的玩家可以想象一下,從零開始,玩到熟悉遊戲規則,能夠使用乙個英雄需要的時間,再想象一下往上提公升到頂級選手的時間,就我個人的理解這裡還有數十倍以上的差距。

當然這不是唱衰,對機器來說數十倍的差距很容易逾越,也許只需要一年就足以和人類抗衡,真正吸引人的是以現有OpenAI的架構,光憑算力的增長提公升是否有上限。我還沒仔細的讀完原文,但是光看翻譯並沒有什麼特殊的架構。

14樓:

有點厲害,如果繼續用這個規則的話,打贏四皇也不新鮮。

不過這個AI可以再練練。限制有點多,把有利於人類的全禁了,那還玩球兒。

在操作層面,AI本來就全方面碾壓人類,沒什麼說的。

八月份打算乾掉頂尖職業選手?可以歇歇了

如果不把AI有針對性的訓練成推進套路的話,短時間內不看好AI可以乾掉人類,尤其是職業選手。

15樓:

AI的理論上線絕對是吊打人類的,但是AI的實際水平還是要看AI程式實現的水平(以前唱衰AI的原因就是懷疑實現水平)。

去年(ti7期間)的AI可以在1v1過程中勝出,其實就顯示了AI的實際個人能力是超越人類選手的。但後來一般玩家選手在1v1的時候直接繞塔斷兵AI直接就傻了。

當機器訓練把所有的妖路子都學習過了,估計就吊打人類了,但是就現在來說,AI要吊打人類我覺得還需要時間,但可能比我以前認定的時間要短。

另外從文章中給出的資訊可以看出,從AI的角度來看,AI學習dota2的複雜度比圍棋高不少。

如何看待OpenAI Five 2 0 戰勝TI8冠軍隊伍OG?

黑桃明 首先提出觀點,這次OG是有娛樂嫌疑,但是不存在放水,兩盤大比分落敗 第二局直接碾壓 完全不可能是 放水 的結果,打到最後OG自己都懵了。以下是回答 在貼吧大神眼裡,現階段OG的狀態,估計只有4000分左右,在彈幕大神的眼裡,去年的LGD能單手打爆這支OG。但是,其實這支OG依舊是99.9 的...

如何看待腿毛多的男生?

純色玫瑰 正常看啊!男生腿毛多點很正常的,因為男生的雄性荷爾蒙比較旺盛,所以腿毛就長得多,在說現在男生出門上班也不穿短褲的,並不會漏出腿毛啊,現在的脫毛方法也有很多的,所以就不要操心男生長不長腿毛了。 時光取名叫無心 有腿毛不是很正常嘛?況且還是男孩子,中醫講腿毛多,說明雄激素旺盛,雄激素旺盛說明男...

如何看待「日本進入多死社會」?

申雅山 其實這是老齡化社會的必然階段,按目前來看這就是十幾年後中國的寫照而已。而中國以後的老人將更悲慘。也就是中國的獨生子女政策後的幾代人。中國只會更恐怖,如果智慧型化不能提前到來,養老會成乙個國家的巨大包袱! 青鳥 按目前生育率和死亡率,日本人口50萬的城市將注定接連消失,100萬的也未必能自保!...