美國晶片禁令迫使中國的科技業者研究變通辦法,在拿不到最新型美國晶片下繼續研發AI人工智慧。使用軟體補強較低階晶片或將多種低階晶片並聯的研究在中國越來越多。
《華爾街日報》檢視論文和訪談相關企業人員發現,包括華為、百度及阿里巴巴集團在內的中企,正研究如何靠用較低階晶片或少用高階晶片下,仍能研發最先進人工智慧的技術,也在研究如何整併不同類型晶片以免依賴任何單一硬體。
研究人員與分析師認為,靠這類變通辦法想追上美國AI領先群難度不低,然而一些研究顯示這種變通措施並非白工,若進展順利也許真能讓中國科技企業既挺過美方制裁,又增加對日後美方更多設限的免疫。
隨商業化ChatGPT這類AI的競賽加溫,全球各地的業者都需要功能更強大的晶片並盡量將功能發揮到極致,好降低AI研發的成本。
AI研究人員與產業分析師指出,對中國企業而言相關課題更為關鍵,因為美方制裁讓他們拿不到諸如輝達(Nvidia)等公司所製的最先進晶片,且在研發比肩ChatGPT這類AI時又快速消耗手上的美國晶片庫存。
繼美國商業部去年10月向中國供應晶片實施全面限制後,拜登政府已表明還會祭出進一步制裁。
中國業者已無法再取得業界研發AI時最愛用的輝達A100晶片,以及今年3月發表的下一代、有更強運算能力的H100;為符合華府政策,輝達提供中國的是降階版A800、H800,這兩種都削弱晶片本身與其他晶片的聯通能力。
雖然A800、H800對研發規模較小AI諸如TikTok短影音app的推薦演算是不錯的替代選項,卻扼殺規模較大型AI的研發。
瑞士銀行集團(UBS AG)分析部門估計,必須用上5000到1萬片A100晶片,才能鍛鍊ChatGPT這種規模與等級的AI。據一個與中國政府關係密切的半導體產業協會近日於一場業界閉門會議公布的調查,中國只有區區4萬到5萬片A100。
經營AI基礎設備公司的新加坡國立大學教授尤洋表示,許多中國企業現嘗試合併3或4片較低階晶片(含A800與H800),模擬1片最高階輝達晶片的效能。騰訊今年4月就公布一套新的運算集群:用一套H800並聯晶片組,進行大型AI模型訓練。
尤洋說變通方式代價不斐,因為若美企訓練大型語言運算模式需用1000片H100,中國企業就需3000片以上的H800達成類似效果。
尤洋指出,為此部分中企加速開發跨型號晶片訓練大型AI模型的技術。有論文顯示阿里巴巴、百度、華為都在研究整併輝達的A100、上一代的V100與P100,以及華為的Ascends系列。
與此同時,中企也在尋求透過各種軟體技術來幫助訓練大型AI模型的運算強度,這種方法美國企業也有在做,然而中國業者在整合多種軟體技術方面更積極。
中國研究人員已取得進展。今年3月一篇論文顯示,華為研究人員展現如何用這類技術訓練自有的新一代大型語言模型,且只用自家Ascends晶片。儘管仍有一些瑕疵,華為的PanGu-Σ大模型在一些華語任務裡已達成最高端性能表現,包括閱讀理解和文法問題。
半導體研究與顧問公司SemiAnalysis首席分析師巴特爾(Dylan Patel)表示,在拿不到最新輝達H100晶片的情況下,中國研究人員的難關只會更高。H100含有額外的性能提升功能,尤其有助訓練類似ChatGPT的模型。
但去年百度公司與深圳鵬城實驗室一份論文顯示,研究人員正以無需H100額外提升功能的方式訓練大型語言模型。巴特爾說儘管研究還在初階,但看來有效。
巴特爾說:「若應證確有效果,他們就能有效躲過制裁。」