美國封鎖也不怕，中國AI產業要怎麼「戴著鐐銬起舞」？-風傳媒

再來，從2023年底以來，愈來愈多開發者使用「專家混合模型」（Mixture of Experts，簡稱MoE）的技術。這種方法利用初始路由機制，將問題分派給各個專門模型。舉個例子來說，就類似餐廳主廚將義大利麵訂單交給義大利廚師處理，這種方式也進一步減輕了晶片的負擔。

騰訊表示，他們去年11月發布的MoE模型性能，可以媲美Meta旗下Facebook在去年7月推出的Llama 3.1模型。根據審閱過兩家公司論文的研究人員說法，騰訊的模型大約只用了Meta模型訓練所需運算能力的十分之一。

硬體不行　就靠軟體實力

DeepSeek原本是量化避險基金管理公司High-Flyer的AI研究部門，這家公司的特色是利用AI進行投資交易。2021年，DeepSeek將約一萬個Nvidia的A100晶片連接成集群，用作AI訓練，稱為Fire-Flyer 2。

DeepSeek在去年8月發表的論文中指出，Fire-Flyer 2的性能接近以類似晶片構成的Nvidia系統，但中國系統的成本和能源消耗更低。去年5月他們發表的MoE模型論文，採用了更高效處理數據的技術，在業界引起廣泛討論。

Anthropic人工智慧新創公司聯合創辦人傑克·克拉克（Jack Clark）在部落格中提到DeepSeek的集群，並這麼寫道：「中國會建立極其優秀的軟硬體訓練系統，用目前可利用的硬體來繞過出口管制。」他還說：「未來，AI模型的『中國製造』將會和電動車、無人機一樣實現。」

許多中國AI開發者還透過中間商交易和海外數據中心等途徑，找到非最新的Nvidia晶片也能達到效果的方式。

即使如此，中國業內高層指出，缺乏最頂尖的晶片對新創公司來說依然是一大痛點，而且這個差距可能會一步步拉大，更遑論其他公司正準備大規模部署輝達的最新AI晶片「Blackwell」。

此外，伊隆·馬斯克（Elon Musk）新創的xAI公司，已經建立了一個配備10萬個Nvidia晶片的數據中心，最近還多籌集了50億美元來擴大規模。亞馬遜網路服務（AWS）則計劃用數十萬顆自家晶片，建造一個龐大的AI超級計算機。

專注於開源模型的DeepSeek特別強調數學與程式設計，月之暗面則以類似ChatGPT的聊天機器人「Kimi」，因為擅長處理長篇文本，在中國市場擁有相當高的人氣。

相比之下，中國AI新創公司的估值遠遠低於美國公司。以估值達1570億美元的OpenAI來對照，北京的智譜AI在去年12月最新募資中估值大約只有30億美元。主要因為投資人普遍還對將技術轉化、變現的能力持保留態度，激烈的市場競爭也引發了供應商之間的價格戰。

智譜AI在去年11月底展示了AI代理，7月則推出了類似OpenAI Sora的影片生成模型。根據知情人士透露，由於估值不如預期，他們推遲了原訂2025年下半年上市的計劃。

過去曾任北京一家AI模型公司的主管黃浩德，將中國AI產業比喻為「戴著鐐銬跳舞」。他說：「專注於我們擅長的領域是唯一的生存機會，甚至可能是取勝的關鍵。」AI發展並非只有一條路，在相對不利的情況下，比起美國的全方位開發，利用現有資源繼續鑽研數學運算、軟硬體訓練等長項，才是中國的突破之道。

本文為風傳媒特邀導讀人金牛幫幫忙撰寫，請點此訂閱：風傳媒・華爾街日報VVIP，風傳媒會員獨享全球最低優惠價，暢讀中英日文全版本之華爾街日報，洞悉國際政經最前沿。

責任編輯／林彥呈

1 2 全文閱讀