引言:王銘琬,世界級棋手。1961年台南生;13歲赴日,,2000年、2001年連獲二屆日本歷史最悠久的頭銜本因坊,2002年又獲得王座頭銜;棋風創新獨特,自成一格,有「銘琬世界」之封號。他也是唯一長期觀察、參與電腦圍棋活動的世界級棋手;2014年擔任趨勢科技圍棋軟體「GoTrend」顧問。
圍棋AI們的個性與魅力
AI三兄弟,最早學棋的老大DeepZenGo棋力相繼被AlphaGo弟弟們超越,哥哥後來下輸弟弟,這也是人類世界中兄弟學棋的典型模式,但是,棋力稍差一點,不等於對社會的貢獻比較少,它們的未來都值得期待!
我們先從特徵來看看它們的個性與魅力。
AlphaGo 不斷創新領導技術
Master是AlphaGo的網名,在此我把它當成AlphaGo一起討論。
說到AlphaGo,最先讓我想到的是它沒有為了圍棋而加入特化的技術,除了一開始用人類棋譜學習以外,對於圍棋本身可說是盡量讓它「自己領悟」,從AlphaGo自由自在的棋譜,也可以看出這個方向。
AlphaGo沒有專為圍棋而搞特化技術,是理所當然的事。因為Google 之意本不在圍棋,是把它當開發技術的工具,不加入特別技術才會有泛用性。圍棋變化的廣闊,正好讓AlphaGo雖沒有為圍棋特化,也能尋找到很好的途徑。
AlphaGo當然還在不斷改良中,從Master可以看出,它對棋局最後階段的「官子」與「地」的辨認等都有進步跡象,其他如先前所介紹的「敵對性學習」等,也隨時在加入新技術,強大的二十人高水準團隊,讓人對今後其他領域的技術移轉期待不已。
要做圍棋AI,從AlphaGo的論文開始,現在已成「定石」,但AlphaGo的方法雖是很好的方法,並非唯一的方法,圍棋作為測試工具,應該不限於這次吧!
製作者哈薩比斯曾表示,AlphaGo也有沒學習棋譜的版本,讓人猜想可能會用這個版本與柯潔對陣,但二○一七年五月對柯潔三番棋之前,有關此事沒有發出任何訊息,說不定沒有棋譜學習,還真不容易進步,來不及達到現在的棋力水準。真相有待下回揭曉。(註:本文寫在柯潔與AlphaGo對戰之前,最新進度柯潔連二敗)
看了哈薩比斯在二○一七年四月的發言、演講等,覺得他是越來越喜歡圍棋,有一天拋開研發,專心當圍棋迷也說不定。
DeepZenGo 職人單挑大企業
DeepZenGo 由尾島陽兒和加藤英樹共同開發,但是有關程式方面,幾乎是尾島陽兒一個人在做,加藤英樹雖然精通程式,實際上擔任所公關宣傳及尾島的諮詢對象。尾島屬於天才型程式師,不擅於對外交際,現在又還有如何運用深層學習等問題,沒有加藤,尾島也是寸步難行的。