現在氣勢旺盛的人工智慧技術,是以機器學習類神經網路為主流的。雖然募資中的創業家和不同投資哲學的風險資本家滿嘴都是人工智慧,彷彿世界上所有的問題都即將被人工智慧解決,但機器學習本質上並不適合我常說的「1%問題」(1% problem)。
我所謂的「1%問題」,是指雖然只有極低的機率會出現極端狀況,但一但出現極端狀況,其後果往往非常嚴重,以致於讓整體回報期望值跌落為負值。
簡單以數學解釋的話,我們可以假設一個抽籤遊戲。籤筒中有99隻白籤和1隻黑籤,抽中白籤的話可以得到美金$100,抽中黑籤則得賠美金$9,900,那麼這個抽籤遊戲的淨回報期望值為美金$0:
99% × $100 + 1% × (−$9,900)=$0
基本上這是一個不賺也不賠的遊戲,理性的金融思考邏輯下,任何人都不應該玩這個遊戲,因為期望回報為$0,但波動性大於0(有99%機會可能賺錢、有1%機會可能賠錢),比起啥都不做(波動性為0)就可以穩穩的賺到(或賠掉)$0來說應該是一個比較不具吸引力的遊戲。
如果上面這個遊戲在抽到黑籤時必須要賠出超過$9,900的金額,遊戲的回報期望值就會變成負值,成為一個不管什麼狀況下,理性的金融人都不應該參與的遊戲。
接下來,我們把這個99%正確率的場景對應到影像辨識,也正是機器學習最早出現突破的範疇。
類神經網路的主要演算法其實在很早以前就已經存在,但實際的應用很有限,除了現任臉書AI長的Yann LeCun大神當年在貝爾實驗室開發的支票手寫辨識機器得到廣泛的運用以外,大部分通用影像辨識仍然錯誤率很高而且速度奇慢無比。二十一世紀前十年,關於電腦永遠無法擊敗人腦的說法常常採用一個簡單的例子:人類的小孩沒什麼知識,但只要看過貓這種動物幾次,不用特別學習就可以十拿九穩地辨認出任何外貿的貓來,但這麼簡單的問題電腦卻常常掙扎半天還是頻頻出錯。
但是在研究者發現使用繪圖晶片(GPU)進行類神經網路運算的速度,遠比用中央處理器(CPU)快很多後,事情開始有了爆發性的進展。2012年的ImageNet影像辨識大賽(ILSVRC,ImageNet Large Scale Visual Recognition Challenge)中,一個深層卷積網路達成16%的辨識錯誤率,兩年後的贏家則一舉突破10%來到7%,隔年2015年年底,機器終於超越人類平均5%錯誤率的辨識能力來到3.6%,2017年的ILSVRC大賽的38支隊伍裡更是有高達29支都成功摜破5%——看來在各種影像辨識的任務中,使用任勞任怨的機器取代任性的人類已經是不可逆的進程?