美國封鎖也不怕,中國AI產業要怎麼「戴著鐐銬起舞」?

2025-01-09 12:00

? 人氣

再來,從2023年底以來,愈來愈多開發者使用「專家混合模型」(Mixture of Experts,簡稱MoE)的技術。這種方法利用初始路由機制,將問題分派給各個專門模型。舉個例子來說,就類似餐廳主廚將義大利麵訂單交給義大利廚師處理,這種方式也進一步減輕了晶片的負擔。

透過<Google新聞> 追蹤風傳媒

騰訊表示,他們去年11月發布的MoE模型性能,可以媲美Meta旗下Facebook在去年7月推出的Llama 3.1模型。根據審閱過兩家公司論文的研究人員說法,騰訊的模型大約只用了Meta模型訓練所需運算能力的十分之一。

硬體不行 就靠軟體實力

DeepSeek原本是量化避險基金管理公司High-Flyer的AI研究部門,這家公司的特色是利用AI進行投資交易。2021年,DeepSeek將約一萬個Nvidia的A100晶片連接成集群,用作AI訓練,稱為Fire-Flyer 2。

DeepSeek在去年8月發表的論文中指出,Fire-Flyer 2的性能接近以類似晶片構成的Nvidia系統,但中國系統的成本和能源消耗更低。去年5月他們發表的MoE模型論文,採用了更高效處理數據的技術,在業界引起廣泛討論。

Anthropic人工智慧新創公司聯合創辦人傑克·克拉克(Jack Clark)在部落格中提到DeepSeek的集群,並這麼寫道:「中國會建立極其優秀的軟硬體訓練系統,用目前可利用的硬體來繞過出口管制。」他還說:「未來,AI模型的『中國製造』將會和電動車、無人機一樣實現。」

許多中國AI開發者還透過中間商交易和海外數據中心等途徑,找到非最新的Nvidia晶片也能達到效果的方式。

被鐐銬限制的中國 要怎麼挺過逆風?

即使如此,中國業內高層指出,缺乏最頂尖的晶片對新創公司來說依然是一大痛點,而且這個差距可能會一步步拉大,更遑論其他公司正準備大規模部署輝達的最新AI晶片「Blackwell」。

此外,伊隆·馬斯克(Elon Musk)新創的xAI公司,已經建立了一個配備10萬個Nvidia晶片的數據中心,最近還多籌集了50億美元來擴大規模。亞馬遜網路服務(AWS)則計劃用數十萬顆自家晶片,建造一個龐大的AI超級計算機。

專注於開源模型的DeepSeek特別強調數學與程式設計,月之暗面則以類似ChatGPT的聊天機器人「Kimi」,因為擅長處理長篇文本,在中國市場擁有相當高的人氣。

相比之下,中國AI新創公司的估值遠遠低於美國公司。以估值達1570億美元的OpenAI來對照,北京的智譜AI在去年12月最新募資中估值大約只有30億美元。主要因為投資人普遍還對將技術轉化、變現的能力持保留態度,激烈的市場競爭也引發了供應商之間的價格戰。

智譜AI在去年11月底展示了AI代理,7月則推出了類似OpenAI Sora的影片生成模型。根據知情人士透露,由於估值不如預期,他們推遲了原訂2025年下半年上市的計劃。

過去曾任北京一家AI模型公司的主管黃浩德,將中國AI產業比喻為「戴著鐐銬跳舞」。他說:「專注於我們擅長的領域是唯一的生存機會,甚至可能是取勝的關鍵。」AI發展並非只有一條路,在相對不利的情況下,比起美國的全方位開發,利用現有資源繼續鑽研數學運算、軟硬體訓練等長項,才是中國的突破之道。

本文為風傳媒特邀導讀人金牛幫幫忙撰寫,請點此訂閱:風傳媒・華爾街日報VVIP,風傳媒會員獨享全球最低優惠價,暢讀中英日文全版本之華爾街日報,洞悉國際政經最前沿。


責任編輯/林彥呈

喜歡這篇文章嗎?

金牛幫幫忙喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章