中國象棋人機大戰
1988年舉辦第一屆電子計算機象棋大賽。1999年起開始舉辦人腦對電腦的象棋比賽,2010年第11屆人腦對電腦象棋大賽由國手劉國華(八段)、馬仲威(七段)與象棋世家、鷹眼對奕,結果一勝兩和一負平手收場。電腦程式棋天大聖(2006, 2007年電腦奧林匹亞金牌)在2007年與象棋特級大師吳貴臨對弈兩局皆以和局收場。2006年起中國機器博弈錦標賽開始每年舉辦,由比賽棋類電腦軟體(電腦程式)對弈。
2006年後電腦象棋棋力已經可以與象棋高手抗衡。目前比較知名電腦象棋有象棋名手、佳佳象棋、象棋旋風、象棋奇兵。
圍棋人機大戰
電腦圍棋始於1970年代,普通棋手都可以輕易打敗電腦圍棋。應氏盃創辦者應昌期在1986年看到電腦圍棋連兒童組冠軍都贏不了,懸賞100萬美元獎勵研發能打敗圍棋冠軍的圍棋軟體(截至期至2000年底)。2015年3月,一款由韓國專家林宰范(Lim Jae-bum)開發的「石子旋風」(Dol Baram),在趙治勳九段讓四子的情況下竟獲得勝利。11月在北京舉行的世界計算機圍棋錦標賽冠軍軟體「石子旋風」,與中國新科名人冠軍連笑七段交手在讓六子後險勝一盤。中國圍棋隊總教練俞斌九段認為最好電腦圍棋也許尚未達到業餘5段,離戰勝職業高手還相當遙遠。沒想到AlphaGo早在一個月之前以5:0擊敗了歐洲圍棋冠軍樊麾二段,掀起了人機大戰另一波熱潮。2016年3月9日AlphaGo挑戰圍棋一流職業高手李世乭九段,第一盤比賽李世乭就在186手棋投子認輸。後續4局成績尚待揭曉。除上述兩個電腦圍棋之外比較知名的電腦圍棋另外還有Crazy Stone、Zen(Tencho no Igo)及後起之秀Darkforest。
圍棋人工智慧看點
國際象棋及中國象棋棋盤及棋路變化較小,採用窮盡搜索(蠻力搜索Brute-Force Search)評估棋路變化即可對弈。圍棋361格(19x19)變化太多,難以窮舉必須另謀他圖。2006年Crazy Stone開發人Rémi Coulom提出「蒙地卡羅樹搜尋」(Monte Carlo Tree Search MCTS)與「樹狀結構信賴上界法」(Upper Confidence bounds applied to Trees)辦法之後電腦圍棋實力才有長足進步。AlphaGo是Google DeepMind公司的產品,Google在2014年將DeepMind收購,並僱用其執行長人工智慧專家傑米斯·哈薩比斯(Demis Hassabis)發展人工智慧。AlphaGo將幾種人工智慧「評估網路(value network)」、「策略網路(policy network)」及快速推出(Fast rollout)配合MCTS選擇落子位置,開啟了電腦圍棋另一境界。評估網路選擇可以落子的位置,先快速粗略篩選出幾種可能落子位置,再由策略網路評估落子位置下到終盤對勝負影響,如果策略網絡評價太低就不需要繼續下下去而直接將該棋路淘汰,最後再決定理想落子的位置。幾種神經網路彼此交互運作,大大降低需要計算及評估的棋路,從而選出較為理想的下棋位置。Google在2013年併購DNNresearch公司並把它的創辦人傑弗里·辛頓(Geoffrey Hinton)一起僱進Google發展深度學習(deep learning),辛頓能讓電腦電腦像人類一般可以自我學習。AlphaGo已把深度學習納入體系,讓學習過圍棋的幾台電腦對弈,增強學習效果。當宣布與李世乭競技之後,AlphaGo每天不斷對弈300盤圍棋,根據哈薩比斯評估,AlphaGo已經受過人類專家下圍棋的3,000萬種步驟訓練,又跟電腦反覆對弈,具備相當於人類1000年的學習量。到比賽時候AlphaGo已經以幾乎全勝的結果擊敗所有現有其它知名電腦圍棋及三屆歐洲冠軍職業二段樊麾。