對於「自我對戰強化學習」,DeepZenGo 並不熱心,這個領域是哈薩比斯的拿手好戲,也是AlphaGo 的重要武器之一,老大哥不走同一條路,可謂「真有志氣」。
加藤英樹在開跑記者會時表示,DeepZenGo 不同於AlphaGo,有長年「特化於圍棋」的技術,若能各取DeepZenGo 、AlphaGo 的所長,就能超越AlphaGo。
尾島曾在採訪中說過「自己都不要動,程式自己會變強的話最好」,應該不是羨慕AlphaGo,而是因為DeepZenGo 要變強都得自己動手,事實上DeepZenGo 的路線還是保留自己的圍棋技術。AlphaGo 是在大企業的大架構下成長,DeepZenGo 則是以日本「職人」精神打造的個人作品。
DeepZenGo 走自己的路,當然值得為它加油。
絕藝 與職業棋士互動令人佩服
絕藝邀請羅冼河九段先生作陪練等技術指導,對研發進度有非常大的幫助,令我佩服。職業棋士與AI程式師、技術師的合作,並非簡單的事,圍棋與程式原本是相距頗遠的領域,而要在程式內容合作,不像一般人與人的關係,可以適可而止,必須先全面理解對方的思維,才能做深度的溝通;若無互信互動的交流,無法得到真正的成果,雙方的經驗與專長、思考模式都不一樣,實在需要很大的努力。
絕藝由AlphaGo 的論文出發,但已經開拓了自己的方向,除了與職業棋士合作; AILab 透露,絕藝在訓練中利用騰訊的雲端運算,得到高質量數據,這是騰訊集團才做得到的,也是絕藝大局觀正確,行棋安定的一個原因。
此外,絕藝在自我對戰學習過程中,有新的強化學習方法,加強了戰鬥攻殺的能力,能創造出更優質的自我模擬數據,從而導致了更強的模型。和很多其他圍棋AI相比,絕藝的對殺能力會更強。
絕藝團隊負責人的劉永升表示,圍棋技術可以提升的空間還很大,他們研發的目的不是打敗人類,而是磨練技術以轉換到別的領域,研究的過程本身會給人類帶來經驗和新的理論。
*作者為世界級棋手。本文選自作者新著《迎接AI新時代:用圍棋理解人工智慧》(遠流出版)