日前AlphaGo Master人工智慧又打敗了世界第一的大陸棋王柯潔,自此擺脫人類知識,走向左右手對戰的自我學習之路。
為什麼AlphaGo那麼厲害?因為它將下一步棋可走的最終成功率,建成了一個「蒙地卡羅決策樹」。然而棋盤中可以走的路實在太多了,所以第一步就是要向人類老師學習。將過去各高手所下的棋都學一遍,然後將勝負記進這蒙地卡羅決策樹中。這就是所謂的「監督學習」,有老師在旁邊看著。再來就是自已左右手對戰,把過程和勝負同樣輸入決策樹中,變成了「增強學習」。如今再沒有人類老師可以學習了,所以AlphaGo就剩下增強學習一途。
AlphaGo Master同時並應用了目前人工智慧中最流行的CNN。噢,不是我們想的那個,而是「Convolution Neural Network」。一種當今最熱門,模仿人類大腦結構的人工智慧類神經網路,照片識別、語音秘書、自動駕駛都靠它。數十年來沒什麼進展的類神經網路,拜雲端運算所提供的大量運算能量之賜,這幾年突然又掀起了一股熱潮。
這個類神經網路提供了「全局觀」,並經由「策略網路」與「價值網路」來決定下一步棋的落子位置。前一版的AlphaGo可以考慮未來50步棋的優劣,這真的不是人腦所能能負荷。到此,人類也要繼象棋和西洋棋之後,在圍棋這一塊再舉起白旗了。
現在人工智慧可以運用的地方越來越多,去年美國辛辛那堤大學開發的空戰人工智慧無人機ALPHA,就擊敗了資深的飛行教官。它運用了遺傳模糊樹(genetic fuzzy tree)的決策系統,將高階戰術、射擊、逃脫、防禦等各式戰鬥方法建入這個人工智慧系統中。你一有動作,它馬上會有應變措施,反應比人類快了兩百五十倍,弄得教官精疲力竭。整個空戰是在一個由波音公司開發像電動玩具般的AFSIM系統中進行。它真實得複製了現代空戰環境中的戰機、偵測器和武器的行為模式,在加入雜訊與失敗率後,將偵測器資料送給無人機ALPHA,讓ALPHA根據指派任務與決策系統邏輯來操縱飛機與武器系統。這些設計細節都在2016年6月的「Journal of Defense Management」中揭露。
現在這類的無人戰鬥系統有兩條發展路線,一條路線是製造全新的無人機,另一條路線則是將現有設備改裝成為無人操控機。最近美國洛克希德馬丁公司就展示了由F-16改裝的無人機跟隨有人機飛行,讓無人自動駕駛機與有人機隊結合成一個團隊一起行動。這裝有自動防撞系統的無人機,能跟著有人機組編隊飛行,待接近目的地時就離隊去執行對地攻擊任務,同時也應付各種突發威脅,待任務完成之後再重新加入團隊編隊飛行。