台灣AI自建》台灣何時能擁有自己的生成式AI?現狀:企業都拿國外開源模型來練!

2024-08-09 06:40

? 人氣

國科會於今(2024)年5月舉行「推動可信任生成式AI發展先期計畫-TAIDE」計劃成果發表會。國科會吳政忠主委於活動上致詞。圖源:國科會提供。

國科會於今(2024)年5月舉行「推動可信任生成式AI發展先期計畫-TAIDE」計劃成果發表會。國科會吳政忠主委於活動上致詞。圖源:國科會提供。

儘管近期全球科技股普遍回檔,令AI未來發展浮現降溫疑慮,但長期而言,AI大幅改變人類社會仍是不爭的事實。究竟輝達創辦人黃仁勳形容「每個國家都將建置自己的主權AI」,描繪的是怎樣的未來?風傳媒帶你一次看懂。

[啟動LINE推播] 每日重大新聞通知

什麼是主權AI? 

主權AI是指各國利用自有的基礎設施、數據資料、人力,在產學界或政府支持下,打造自身的人工智慧(AI)。這意味著國家可以自主開發和控制大型語言模型(LLM),以訓練成各種AI應用,而不需依賴外部技術或與它國企業合作。 

主權AI的概念反映了各國對AI技術的戰略,形同國力展現,日漸受到國家重視,提撥資源挹注。隨著AI在各行各業的應用日益廣泛,小至電商的對話機器人,大至國防的戰略輔助模型,掌握AI技術的國家將在未來的國際競爭中佔據優勢。因此,各國紛紛加速投資、發展本土AI能力,以確保技術研發的自主性,且重要數據掌握於自家研發的大型語言模型。 

黃仁勳也在強調主權AI?輝達的下個重點業務搶先看 

輝達執行長黃仁勳在今年5月訪台時,高度讚賞台灣供應鏈夥伴,在AI新時代展現重要性。黃仁勳表示各國應確保擁有和保護好自己的情報和數據,並敦促各國建立他所謂的「AI主權」(Sovereign AI)。他認為,每個國家都應投資發展自身的AI能力,因為數據資料就如同自然資源一樣寶貴,應將其轉化為AI實力。 

輝達財務長柯蕾絲(Colette Kress)日前在財報會議中透露了輝達對「主權AI」業務的重視。她綜觀各國對本土人工智慧技術的開發和投資趨勢,認為這項新興市場領域的估值將上看好幾十億美元;並對輝達今年在「主權AI」業務方面的營收表示樂觀。 

20240604-輝達執行長黃仁勳4日出席NVIDIA全球記者會。(顏麟宇攝)
輝達執行長黃仁勳6月出席NVIDIA全球記者會。(顏麟宇攝)

台大資工系的AI開發團隊對「主權AI」持有類似的看法。風傳媒訪問主要開發人員,台大資工系博士候選人林彥廷,他認為自建一套AI語言模型,所應具備的技術和迭代能力,開發團隊規模,算力和運算效率的規劃與調度等面向,都能展現出國力。 

為什麼台灣建立自己的AI很重要? 

在風傳媒的訪問中,林彥廷告訴我們,若要將台灣自建的語言模型做得好,「要先把台灣的資料灌入最原始的大腦」。他指的是大型語言模型(LLM)訓練使用的資料,從一開始就必須拉高台灣的占比,而非拿國外已經完成的開源模型,如Meta的Llama、Google的Gemma再加入台灣的數據、資料。 

「這就好像美國小孩從小就學了台灣的文化和語言,可以理解台灣的用字、用語,長大後我們再接過來調整成台灣工作者,可以少掉很多訓練工作。」接著,林彥廷也指出國外模型放入的台灣資料數過少的原因。「現在台灣的能見度那麼高,國際的廠商很願意拉高台灣資料的占比,問題是台灣這邊很缺資料,很多資料我們甚至可能連數位化都沒有做…,我們現在需要的是整座國家圖書館藏書的量,」他語氣很無奈。 

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章