不夠格的投資者們,就像他們在精實新創浪潮中追著浪尾投資已經有數十家先行者的新創類型一樣,忙不迭地把錢灌進「能夠描繪某種AI使用情境」的軟體新創。稍微謹慎一點的投資者們,找來了從事相關研究的教授或者博士班學生來幫忙作盡職調查,以求避開明顯的騙子。
但不管是哪一種,打著「用AI取代人類」嘴砲的軟體新創仍然面臨兩個自己無法解決的挑戰。
其中一個就是我常常講的,就算是絕頂聰明的數學家或者資料科學家,如果無法取得訓練模型用的資料,那也是白搭,這也是為什麼在Hardware Club我們選擇投資提供從感測器到雲端機器學習完整系統的Full-stack AI新創。
另ㄧ個純軟體AI新創面臨的挑戰,則是在創業或者投資初期常常被忽略的硬體計算能力的限制。
我在〈軟體吃掉世界,AI吃掉軟體〉一文中就曾經提到過,精實新創誕生的背景是晶片運算能力遠大於終端應用軟體所需,但機器學習的出現瞬間把這個落差給「闔上」了——突然間我們從毫不在乎硬體,又變得必須對硬體規格斤斤計較。
上面這個影片是史丹佛大學CS231n課程〈卷積神經網路在影像辨識上的應用〉第十五堂課的講座影片,主講者是最近剛取得電機暨計算機科學博士學位、明年即將在麻省理工開始任教的Song Han,講座的題目就是他的博士論文〈深度學習的高效率演算法和硬體〉。我強烈建議對於機器學習有興趣的人——不管是創業家或投資者——把這個講座影片看完,因為看完之後他們就能理解為什麼我說AI真正的主戰場在硬體。
舉例來說,這整個講座使用的術語大約有三四成是機器學習和深度學習相關的,剩下的術語卻都是所有半導體產業的「老人」們再熟悉不過的:CPU、GPU、FLOPS、DDR 3、DDR 4、記憶體頻寬⋯⋯等。事實上如果直接去閱讀Song Han的博士論文,老半導體人會看到兩個很親切的名字:論文的主要指導教授Bill Dally以及協同指導教授Mark Horowitz。其中Dally教授所著作的教科書〈Digital Systems Engineering〉幾乎所有電機本科生人手一本,而Horowitz教授則是我當年在半導體的研究領域『高速數位串流介面』的權威,如果把我當年閱讀過的他的論文疊在一起,就算沒辦法到頂天花板,最少也夠站在上面換燈泡。
Song Han在這兩位半導體老將的指導下完成這個博士論文,而且還受邀在CS231n〈卷積神經網路在影像辨識上的應用〉課程給講座的原因非常簡單:我們現在的CPU或者GPU、甚至於谷歌的TPU,都遠遠無法應付現有機器學習演算法「可能」的運算需求,因此軟硬體協同開發是必要的。