一文看懂DeepSeek!中國最新AI模型有何特別,為何能撼動矽谷與亞洲科技股價

2025-01-27 20:50

? 人氣

AI晶片目前被視為美中科技戰的核心,所以輝達(Nvidia)才會那麼炙手可熱,美國政府也才會那麼努力限制AI晶片的出口。但DeepSeek的表現美國的貿易限制顯得如此無力,因為中國研究人員在被迫使用網上免費工具來發揮創造力,卻仍能做出能力不亞於競爭對手表現的產品。風險投資公司Page One Ventures的投資人克里斯·尼科爾森(Chris  Nicholson)說:「擁有600萬美元資金的公司,在數量上遠遠多於有1億美元或10億美元資金的公司。」這也意味著,過去認為「只有掌握巨額資金、有本事大量購入AI尖端晶片的科技巨頭才有能力發展AI」的觀念,如今必須修正—即使是資源微不足道的組織或者企業,也能構建具有競爭力的系統。

透過<Google新聞> 追蹤風傳媒

DeepSeek的橫空出世,也讓日本晶片公司Disco Corp和輝達的合作伙伴愛德萬測試(Advantest)27日分別下跌2.6%和8.8%,中國領先的晶片製造商中芯國際下跌2.9%。美國的隔夜交易顯示,人工智慧風向球輝達(Nvidia)可能在週五收盤時開盤下跌。東京一位基金經理對日本科技股的突然下跌表示「肯定是DeepSeek的原因」,他對英國《金融時報》表示,市場正在重新調整觀念,即人工智慧的硬體支出可能比目前的估計低得多。

雖然DeepSeek的旗艦模型是免費的,但用戶將自己的應用程式連接到DeepSeek的模型需要收費,像是直接利用DeepSeek為客戶提供AI答案的企業就要付費。《華爾街日報》指出,去年年初,DeepSeek將這項服務的定價降至遠低於其他供應商的收費水準(畢竟他們不需要購買那麼多昂貴的輝達AI晶片),在中國也拉開了大模型價格戰的序幕。矽谷一家利用生成式AI預測財務回報的新創公司就表示,該公司去年9月從Anthropic的Claude模型跳槽DeepSeek後,發現兩者性能相去不遠,但DeepSeek的成本性能與Claude相似,但成本卻只要四分之一。(相關報導:李忠謙專欄:當DeepSeek震撼美股,刺破「AI泡沫」的那根針出現了嗎?更多文章

《紐時》指出,研發AI模型的領先企業往往動用擁有1.6萬個(甚至更多)晶片的超級電腦來訓練AI,但DeepSeek只用了2000個次級閹割版晶片。喬治華盛頓大學助理教授傑佛瑞‧丁(Jeffrey Ding)表示,中國就是受到了晶片出口的嚴酷限制,迫使DeepSeek工程師「更有效地訓練大模型,以讓其仍有競爭力」。OpenAI前高管卡斯(Zack Kass)也表示,DeepSeek在美國限制下取得的進步,凸顯了一個更廣泛的教訓:資源限制往往會激發創造力。

喜歡這篇文章嗎?

國際中心喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章