14日凌晨2:30,OpenAI Fie在和第八屆Dota2國(guó)際邀請(qǐng)賽世界冠軍OG團(tuán)隊(duì)的比賽中連勝兩局,碾壓了人類選手。
在2018年8月的Ti8 OpenAI表演賽上,人類職業(yè)戰(zhàn)隊(duì)paiN Gaming在5v5的Dota2人機(jī)大中,輕松擊敗OpenAI Five戰(zhàn)隊(duì)。在輸?shù)舯荣愔?,OpenAIFive是通過(guò)在加速的虛擬環(huán)境中進(jìn)行自我改進(jìn)而變得更加強(qiáng)大的。
OpenAIFive由深度強(qiáng)化學(xué)習(xí)提供支持,也就是說(shuō)它的編碼目的不是“如何游戲”,而是“如何學(xué)習(xí)”。Brockman在比賽開始前表示。AI在10個(gè)月中,已經(jīng)玩了45000年的Dota2游戲,而且,玩了這么長(zhǎng)時(shí)間也沒(méi)有覺(jué)得無(wú)聊。
經(jīng)過(guò)了45000年訓(xùn)練的OpenAI Fie在今早的比賽中表現(xiàn)出是迄今為止展示出的最高水平,而且打法激進(jìn),甚至在游戲前期頻繁買活,所以當(dāng)它摧毀OG戰(zhàn)隊(duì)基地時(shí),好多人對(duì)此驚奇不已。但當(dāng)它在第二局以迅雷不及掩耳之勢(shì)碾壓了OG時(shí),贏得了現(xiàn)場(chǎng)觀眾的掌聲。
在這場(chǎng)人機(jī)大戰(zhàn)中,每隊(duì)只有17個(gè)英雄可供選擇。OpenAI還選擇了所謂的“Captain'sDraft”游戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺(jué)功能,這兩項(xiàng)功能都涉及以英雄副本的形式引入其他變量,以及OpenAI訓(xùn)練系統(tǒng)時(shí)未考慮的一些特殊因素和單位。除此之外,這場(chǎng)比賽與正常的Dota2比賽一樣,其最終目標(biāo)是摧毀敵方隊(duì)伍的“基地”,即每個(gè)團(tuán)隊(duì)領(lǐng)土末端的大型塔樓,在敵人的隊(duì)伍成功摧毀其他小型塔后,基地是很脆弱的,整個(gè)比賽過(guò)程的中心是對(duì)塔的攻防,以及英雄與英雄之間的團(tuán)戰(zhàn)。
在第一場(chǎng)比賽中,OpenAIFive讓對(duì)手OG大吃一驚,通過(guò)一系列激進(jìn)戰(zhàn)術(shù)獲得了勝利,其中包括對(duì)游戲中獲取的金幣的花費(fèi)方式,在本方英雄死亡時(shí)立即買活,即使在比賽初期也是如此。
在第二場(chǎng)比賽中,OpenAI表現(xiàn)更好,在最初的幾分鐘內(nèi)即獲得了對(duì)OG的早期優(yōu)勢(shì),然后無(wú)情碾壓了人類玩家,在第一場(chǎng)比賽時(shí)間剛剛過(guò)半的時(shí)間點(diǎn)上即取得勝利。
值得注意的是,OpenAIFive在第二場(chǎng)比賽中開始玩得異常激進(jìn),以致OG在AI全圖范圍內(nèi)的推進(jìn)時(shí)有些無(wú)力對(duì)抗。OpenAIFive能夠利用其特定的英雄選擇帶來(lái)的優(yōu)勢(shì)。
在這場(chǎng)比賽之后,研究團(tuán)隊(duì)將不再公開展示其AI游戲bot,而是致力于開發(fā)軟件,讓人類與OpenAIFive軟件實(shí)時(shí)協(xié)作,與機(jī)器人一起玩游戲,并學(xué)習(xí)他們獨(dú)特的前所未有的戰(zhàn)略和行為。
而最終,OpenAI希望將其Dota2學(xué)習(xí)并擴(kuò)展到游戲之外的新領(lǐng)域,并最終擴(kuò)展到現(xiàn)實(shí)世界中。為此,OpenAI正致力于使用強(qiáng)化學(xué)習(xí)和其他技術(shù),為機(jī)器人手提供更靈巧、更精細(xì)、更人性化的動(dòng)作。