近年來,人工智能(AI)技術(shù)發(fā)展迅猛,并被快速推動應(yīng)用到社會生活的各個方面,智能博弈領(lǐng)域正是其應(yīng)用與實踐的熱點領(lǐng)域之一。2019年12月28日,第三屆全國兵棋推演大賽人機挑戰(zhàn)賽暨首屆全國智能博弈論壇在火熱的氛圍中落下帷幕,來自軍地科研院所、院校、國防軍工企業(yè)和智能博弈領(lǐng)域的260余位專家、學(xué)者觀摩了比賽盛況并參加了論壇交流。
所謂“人機挑戰(zhàn)賽”,即人類選手與AI智能體的對戰(zhàn)。本次挑戰(zhàn)賽的兵棋AI智能體——“戰(zhàn)顱”由國防科技大學(xué)系統(tǒng)工程學(xué)院研制;參加挑戰(zhàn)的人類選手是通過全國兵棋推演大賽總決賽篩選出的11名優(yōu)秀選手。比賽吸引了眾多與會人員的關(guān)注,大家?guī)е鴱娏业暮闷嫘臓幭嗄慷?ldquo;人與人工智能”的精彩對決。
比賽當(dāng)日,國內(nèi)眾多智能博弈與兵棋領(lǐng)域的專家蒞臨現(xiàn)場觀摩,中國指揮與控制學(xué)會監(jiān)事長、中國工程院戴浩院士等嘉賓現(xiàn)場觀摩了比賽并致辭。比賽開幕式由中國指揮與控制學(xué)會理事劉忠教授主持。全國兵棋推演大賽總導(dǎo)演兼總裁判長楊南征、“戰(zhàn)顱”首席設(shè)計師馮旸赫、優(yōu)秀參賽選手代表呂峒臻作為點評嘉賓,對現(xiàn)場比賽進(jìn)行了精彩講解和點評。
比賽開始前,大賽總導(dǎo)演兼總裁判長楊南征介紹說,“戰(zhàn)顱”在賽前已經(jīng)與全國兵棋推演大賽總決賽前48名的選手對戰(zhàn)了36場,目前保持全勝。本次人機對抗賽特別邀請了獲得全國賽特等獎、一等獎、二等獎的11名優(yōu)秀選手分別挑戰(zhàn)智能體,將為我們帶來22場精彩對決。對于比賽結(jié)果,他更希望人類選手能夠挑戰(zhàn)成功。
經(jīng)過1個半小時的緊張角逐,“戰(zhàn)顱”以全勝戰(zhàn)績贏得了冠軍。馮旸赫表示,“戰(zhàn)顱”的研發(fā)基于智能系統(tǒng)工程思想,融合知識推理、監(jiān)督學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)和強化學(xué)習(xí)等一系列方法構(gòu)建智能決策模型,充分利用人人對抗產(chǎn)生的優(yōu)質(zhì)數(shù)據(jù)和機機自打產(chǎn)生的大數(shù)據(jù)對智能體進(jìn)行訓(xùn)練。截止參賽,“戰(zhàn)顱”一共訓(xùn)練了136天,每天一個計算節(jié)點大約自打160盤。據(jù)悉,“戰(zhàn)顱”的主創(chuàng)人員是國防科大一群平均年齡僅24歲的碩士生博士生,該智能體是他們集中攻關(guān)4個多月的智慧結(jié)晶。
中國指揮與控制學(xué)會智能博弈與兵棋推演專委會主任委員黃金才教授表示,從近一個月的參賽表現(xiàn)看,智能體不僅學(xué)會了一些人類選手的經(jīng)典戰(zhàn)法,還獨創(chuàng)了部分特有的戰(zhàn)法戰(zhàn)術(shù)。當(dāng)然,從比賽中也可以看出“戰(zhàn)顱”目前還存在很多局限性,這次戰(zhàn)勝人類選手也只是智能博弈技術(shù)在實踐應(yīng)用中邁出的第一步,他表示,將帶領(lǐng)研發(fā)團隊進(jìn)一步探索智能博弈的“無人區(qū)”,構(gòu)建具有持續(xù)學(xué)習(xí)能力的智能體。
在11位人類挑戰(zhàn)者中,來自軍地院校的王俊翔、武煜強、余雷脫穎而出,成為人類選手的“前三甲”。三位選手在賽后采訪時表示,“戰(zhàn)顱”的優(yōu)點是數(shù)據(jù)分析、學(xué)習(xí)能力強,能針對人類選手的操作、根據(jù)實時態(tài)勢改變應(yīng)對策略,擅長精算、細(xì)算;而人類選手可以通過奇策奇招,針對“戰(zhàn)顱”的策略漏洞進(jìn)行針對性打擊。
針對此次大賽的結(jié)果,劉忠教授表示,AI的獲勝并不代表人工智能技術(shù)在任務(wù)規(guī)劃領(lǐng)域超越了人類,AI智能體是在人類智慧的基礎(chǔ)上研發(fā)出來的,特別是在智能博弈領(lǐng)域,人工智能的學(xué)習(xí)效率及泛化性還有待提高,針對智能指揮與控制,要推動智能博弈技術(shù)從實驗室走向?qū)嵺`應(yīng)用,仍需砥礪前行。
在下午舉辦的首屆全國智能博弈論壇上,來自兵棋推演、智能指控、機器學(xué)習(xí)等領(lǐng)域的四位專家分別圍繞“兵棋推演的前世今生”、“智能指揮控制的實踐與思考”、“多智能體強化學(xué)習(xí)中的博弈與均衡”、“面向星際爭霸的大規(guī)模智能體訓(xùn)練技術(shù)”等四個主題做了精彩報告,為現(xiàn)場觀眾帶來了一場智能博弈與兵棋推演的“學(xué)術(shù)盛宴”。
本次人機挑戰(zhàn)賽作為中國指揮與控制學(xué)會主辦的2019第三屆全國兵棋推演大賽的一項專題賽事,由國防科技大學(xué)系統(tǒng)工程學(xué)院和CICC智能博弈與兵棋推演專業(yè)委員會協(xié)辦,活動得到了中國電科五十二研究所、北京華戍防務(wù)技術(shù)有限公司等單位的大力支持。隨著AlphaGo、AlphaStAR等不斷攻破人類智能高地,人工智能發(fā)展將對各行各業(yè)產(chǎn)生沖擊甚至顛覆性影響。本次“人機挑戰(zhàn)賽”作為探索智能博弈新方法、國防教育新模式的有效手段和載體,必將對人工智能技術(shù)的實踐應(yīng)用產(chǎn)生重要影響。
供稿:程光權(quán)、吳克宇
圖片:何書遠(yuǎn)、劉世旋
編輯:楊勇、劉亞麗