捨去艱澀專業用語,中學生也能讀懂,從迴歸分析、機器學習、深度學習,到人工智慧的科技演進
「AI 對你的企業有什麼意義?看這本書就知道。」人工智慧即將進入低價年代,工作流程、商業模式都該改變。本書《AI經濟的策略思維》用經濟學的分析架構,看穿AI浮誇虛假的炒作,打造屬於自己的最佳策略選擇。
更多數據、更好的模型,以及性能更強的電腦,使得近年來機器學習的進展得以改善預測能力。蒐集和儲存大數據的進步也提供新的機器學習演算法原料。在更適合的處理器發明下,新的機器學習模式明顯比以往的統計方法更有彈性,也產生更好的預測結果,好到有些人又重新稱資訊工程這個分支為「人工智慧」。
迴歸分析
在機器學習之前,資訊處理的核心方法是一種統計技術,稱為「迴歸分析」。迴歸分析是做什麼用的?它是根據過去情況的平均值找出預測值。舉例來說,如果你只看上一週每天的天氣情況來判斷明天是否會下雨,最理想的推測大概是平均值。如果前7 天有2 天下雨,你大概會預測明天下雨的機率是七分之二左右,或是說29%。我們對預測的認識,大多就是藉著建立可納入更多背景數據的模型,讓我們計算出的平均值更好。
我們的作法是利用所謂的「條件平均」。舉例來說,如果你住在北加州,對過去的認識大概就是下雨的機率視季節而定:夏天低,而且冬天高。如果你觀察冬天在任何一天下雨的機率是25%,夏天則是5%,大概不會評估明天下雨的機率是平均值15%。為什麼?因為你知道明天不是冬天,就是夏天,所以你會根據條件來調整自己的評估。
後來,多變數迴歸分析(multivariate regression)提供一種有效率的方法,在不需要計算數十、數百或數千個條件平均的情況下考量多種條件。迴歸分析是取得數據,並努力找出能將預測錯誤降到最低的結果,使所謂的「適合度」(goodness of fit)達到最大。
機器學習
機器學習和迴歸分析的一個重要差異,就是開發新技巧的方法。
機器學習將重心放在實務運作,讓創新者有更多的空間去實驗,即使它們使用的方法所產生的估計值平均下來會不正確,或有偏差。在利用豐富的數據與過去十年出現快速電腦的情況下,這種實驗的自由空間使進展突飛猛進。
所以什麼原因讓機器學習成為革命性的運算科技,甚至能貼上「人工智慧」的標籤?有些情況下,預測好到可以直接取代以規則為主的邏輯。
有效的預測會改變電腦程式設定的方式。無論是傳統的統計方法還是「若則」的演算法,在複雜的環境下都無法良好運作。