一文看懂DeepSeek!中國最新AI模型有何特別,為何能撼動矽谷與亞洲科技股價

2025-01-27 20:50

? 人氣

(Deepseek官網)

(Deepseek官網)

「Deepseek R1是我見過的最令人驚嘆、最令人印象深刻的突破之一」、「這是AI的史普尼克(Sputnik)時刻。」

川普的矽谷風險投資顧問馬克·安德森(Marc Andreessen)

中國的人工智慧以及大型語言模型公司「深度求索」(DeepSeek)是2023年7月才由對沖基金「幻方量化」在浙江杭州創立的一間新創公司,不過這間公司去年底發表的DeepSeek-V3語言模型卻技驚四座。因為該公司宣稱,DeepSeek-V3的訓練僅僅用了2048塊輝達H800型GPU(針對中國市場的閹割低配版GPU)、運行55天變大功告成,訓練耗資557.6萬美元,評測成績卻能與GPT-4o、Claude 3.5-Sonnet等西方頂尖語言模型並駕齊驅,甚至在數學、程式碼、自然語言推理等領域的性能超越了OpenAI o1正式版。

透過<Google新聞> 追蹤風傳媒

《華爾街日報》分析,這意味著美國政府的出口管制根本無法阻止中國AI技術的快速發展。

1月20日,DeepSeek推出了AI模型R1,這是一款為解決複雜問題而設計的專用模型。為川普(Trump)提供諮詢的矽谷風險投資家馬克·安德森(Marc Andreessen)在X上讚嘆「這是最令人印象深刻的突破」。《紐時》認為,DeepSeek令矽谷讚嘆與震動,不是因為這個中國的人工智慧語言模型幹掉了西方或美國的語言模型,而是中國的AI公司使用了遠少於西方AI公司的晶片數量進行研發,這甚至不是目前最先進的晶片,卻能做出一個實力接近西方的AI模型。而且在某些情況下,甚至跳過了美國研發者認為不可或缺的步驟。

各家AI在不同領域的表現評分與排名。(Deepseek官網)
各家AI在不同領域的表現評分與排名。(Deepseek官網)

AI開發商Anthropic的首席執行官達里奧·阿莫代(Dario Amodei)去年曾表示,構建AI模型的成本在1億至10億美元之間,但DeepSeek只花了為560萬美元,這個數字也不到科技巨頭Meta訓練其最新AI模型投入資金的十分之一。加上DeepSeek做的是開源模型,AI模型的軟體程式碼可免費獲取。舊金山AI硬體公司Positron的聯合創始人巴雷特·伍德賽德(Barrett Woodside)說,他和同事一直在熱烈討論DeepSeek,他們目前認為DeepSeek的唯一缺點是中國的言論管制,因爲DeepSeek不會回答習近平的敏感問題,但由於程式完全開源,其他開發人員可以自由移除這項限制。

DeepSeek表示,無論最新的R1或者去年底發表的V3,表現都優於或接近西方領先的模型。截至上周六,這兩個版本的DeepSeek在Chatbot Arena上均排名前十。Chatbot Arena是由加州大學伯克利分校(University of California, Berkeley)研究人員營運的評比平台,對聊天機器人的性能進行評級。目前位列第一的是Google的Gemini,DeepSeek的排名則超過了Anthropic的Claude以及伊隆·馬斯克(Elon Musk)麾下xAI的Grok。

喜歡這篇文章嗎?

國際中心喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章