為期數天的人機圍棋大戰,最終以AlphaGo 4比1的勝利拉下帷幕。回想比賽之前,李世乭其實被很多人看好,畢竟是世界頂尖九段高手而且還曾經贏了18個世界冠軍。而最終李世乭只是憑借機器的重大失誤而扳回一局,AlphaGo的強大特別是大局觀令很多職業選手震驚。
面對這個幾乎被碾壓的結果,對很多人可以說是意料之外。
圍棋是迄今為止人類發明的最複雜的遊戲。在小小的19乘19的棋盤上,雙方各持黑白,輪流下子,只要一方將另一方子圍住就可以吃掉。國際象棋只有64個格子,而圍棋卻有361個格子,其策略選取的複雜度已經加大了好幾十個量級。而圍棋的難度更在於,在看似簡單的遊戲規則裡面,每一步的變化加上「打劫」等特殊規則所產生的運算複雜度是天文數字量級的。
有人計算過,要是把圍棋所有的狀態用窮舉法全部列出大概需要 10的170次方(相比之下國際象棋只有10的46次方)。因此,圍棋也被認為是人工智能攻克信息完全博弈遊戲最後的堡壘。
縱觀人機對戰的歷史,往往是以機器的勝利而告終。1997年IBM的深藍打敗了國際象棋世界冠軍卡斯帕羅夫。2011年IBM的Watson在智力問答電視比賽中徹底打敗兩名世界冠軍。
短短不到幾年的時間,人工智能又攻破了幾乎永遠不可能被攻破的領域——圍棋。如果說,相比1997年IBM深藍的暴力博弈樹遍歷而言,深藍的勝利只是硬件速度的勝利和計算機的勝利。AlphaGo今天的勝利才真正是人工智能的勝利,它標誌著真正人工智能的時代已經開啟。
其實人工智能作為一個學科已經發展了半個多世紀,一直有一群默默無聞的人們從事著這方面的研究,而這次人機大戰才真正的把人工智能放在的鎂光燈下,成為大眾矚目的焦點。
如果說之前的深藍電腦還處於「暴力」人工智能的階段,現在的以AlphaGo為代表的深度學習和強化學習把人工智能推向了頂峰。通過Google發表的文章可以看出,通過深度學習採用海量的專業棋譜訓練策略網路,再用強化學習通過自我博弈訓練估值網路,最終結合兩個網路通過蒙特卡洛樹進行下子決策。
可以看出,這一套流程並不是一種技術的勝利,而是多種人工智能技術結合的產物。這也是近幾年來人工智能的發展方向,通過結合多種模型對問題進行分層和抽像,從而部分地模擬了大腦認知、思考和決策過程。
AlphaGo今天的完勝將會對人類的未來產生深遠的影響。為此,有人歡呼雀躍,有人憂心忡忡。歡呼者為人類在這一領域取得的長足進步而高興,憂心者擔心機器將會在未來取得越來越明顯的優勢,從而最終會取代人類。