14日凌晨2:30,OpenAI Fie在和第八屆Dota2國際邀請賽世界冠軍OG團隊的比賽中連勝兩局,碾壓了人類選手。
在2018年8月的Ti8 OpenAI表演賽上,人類職業(yè)戰(zhàn)隊paiN Gaming在5v5的Dota2人機大中,輕松擊敗OpenAI Five戰(zhàn)隊。在輸?shù)舯荣愔?,OpenAIFive是通過在加速的虛擬環(huán)境中進行自我改進而變得更加強大的。
OpenAIFive由深度強化學習提供支持,也就是說它的編碼目的不是“如何游戲”,而是“如何學習”。Brockman在比賽開始前表示。AI在10個月中,已經(jīng)玩了45000年的Dota2游戲,而且,玩了這么長時間也沒有覺得無聊。
經(jīng)過了45000年訓練的OpenAI Fie在今早的比賽中表現(xiàn)出是迄今為止展示出的最高水平,而且打法激進,甚至在游戲前期頻繁買活,所以當它摧毀OG戰(zhàn)隊基地時,好多人對此驚奇不已。但當它在第二局以迅雷不及掩耳之勢碾壓了OG時,贏得了現(xiàn)場觀眾的掌聲。
在這場人機大戰(zhàn)中,每隊只有17個英雄可供選擇。OpenAI還選擇了所謂的“Captain'sDraft”游戲模式。與之前的比賽一樣,OpenAI也禁用了召喚和幻覺功能,這兩項功能都涉及以英雄副本的形式引入其他變量,以及OpenAI訓練系統(tǒng)時未考慮的一些特殊因素和單位。除此之外,這場比賽與正常的Dota2比賽一樣,其最終目標是摧毀敵方隊伍的“基地”,即每個團隊領(lǐng)土末端的大型塔樓,在敵人的隊伍成功摧毀其他小型塔后,基地是很脆弱的,整個比賽過程的中心是對塔的攻防,以及英雄與英雄之間的團戰(zhàn)。
在第一場比賽中,OpenAIFive讓對手OG大吃一驚,通過一系列激進戰(zhàn)術(shù)獲得了勝利,其中包括對游戲中獲取的金幣的花費方式,在本方英雄死亡時立即買活,即使在比賽初期也是如此。
在第二場比賽中,OpenAI表現(xiàn)更好,在最初的幾分鐘內(nèi)即獲得了對OG的早期優(yōu)勢,然后無情碾壓了人類玩家,在第一場比賽時間剛剛過半的時間點上即取得勝利。
值得注意的是,OpenAIFive在第二場比賽中開始玩得異常激進,以致OG在AI全圖范圍內(nèi)的推進時有些無力對抗。OpenAIFive能夠利用其特定的英雄選擇帶來的優(yōu)勢。
在這場比賽之后,研究團隊將不再公開展示其AI游戲bot,而是致力于開發(fā)軟件,讓人類與OpenAIFive軟件實時協(xié)作,與機器人一起玩游戲,并學習他們獨特的前所未有的戰(zhàn)略和行為。
而最終,OpenAI希望將其Dota2學習并擴展到游戲之外的新領(lǐng)域,并最終擴展到現(xiàn)實世界中。為此,OpenAI正致力于使用強化學習和其他技術(shù),為機器人手提供更靈巧、更精細、更人性化的動作。