一文看懂DeepSeek！中國最新AI模型有何特別，為何能撼動矽谷與亞洲科技股價-風傳媒

「Deepseek R1是我見過的最令人驚嘆、最令人印象深刻的突破之一」、「這是AI的史普尼克（Sputnik）時刻。」

川普的矽谷風險投資顧問馬克·安德森（Marc Andreessen）

中國的人工智慧以及大型語言模型公司「深度求索」（DeepSeek）是2023年7月才由對沖基金「幻方量化」在浙江杭州創立的一間新創公司，不過這間公司去年底發表的DeepSeek-V3語言模型卻技驚四座。因為該公司宣稱，DeepSeek-V3的訓練僅僅用了2048塊輝達H800型GPU（針對中國市場的閹割低配版GPU）、運行55天變大功告成，訓練耗資557.6萬美元，評測成績卻能與GPT-4o、Claude 3.5-Sonnet等西方頂尖語言模型並駕齊驅，甚至在數學、程式碼、自然語言推理等領域的性能超越了OpenAI o1正式版。

透過<Google新聞> 追蹤風傳媒

《華爾街日報》分析，這意味著美國政府的出口管制根本無法阻止中國AI技術的快速發展。

1月20日，DeepSeek推出了AI模型R1，這是一款為解決複雜問題而設計的專用模型。為川普（Trump）提供諮詢的矽谷風險投資家馬克·安德森（Marc Andreessen）在X上讚嘆「這是最令人印象深刻的突破」。《紐時》認為，DeepSeek令矽谷讚嘆與震動，不是因為這個中國的人工智慧語言模型幹掉了西方或美國的語言模型，而是中國的AI公司使用了遠少於西方AI公司的晶片數量進行研發，這甚至不是目前最先進的晶片，卻能做出一個實力接近西方的AI模型。而且在某些情況下，甚至跳過了美國研發者認為不可或缺的步驟。

各家AI在不同領域的表現評分與排名。（Deepseek官網）

AI開發商Anthropic的首席執行官達里奧·阿莫代（Dario Amodei）去年曾表示，構建AI模型的成本在1億至10億美元之間，但DeepSeek只花了為560萬美元，這個數字也不到科技巨頭Meta訓練其最新AI模型投入資金的十分之一。加上DeepSeek做的是開源模型，AI模型的軟體程式碼可免費獲取。舊金山AI硬體公司Positron的聯合創始人巴雷特·伍德賽德（Barrett Woodside）說，他和同事一直在熱烈討論DeepSeek，他們目前認為DeepSeek的唯一缺點是中國的言論管制，因爲DeepSeek不會回答習近平的敏感問題，但由於程式完全開源，其他開發人員可以自由移除這項限制。

DeepSeek表示，無論最新的R1或者去年底發表的V3，表現都優於或接近西方領先的模型。截至上周六，這兩個版本的DeepSeek在Chatbot Arena上均排名前十。Chatbot Arena是由加州大學伯克利分校（University of California, Berkeley）研究人員營運的評比平台，對聊天機器人的性能進行評級。目前位列第一的是Google的Gemini，DeepSeek的排名則超過了Anthropic的Claude以及伊隆·馬斯克（Elon Musk）麾下xAI的Grok。

1 2 全文閱讀

一文看懂DeepSeek！中國最新AI模型有何特別，為何能撼動矽谷與亞洲科技股價

李忠謙專欄：輝達股價單日狂跌17%、丟掉股王寶座—刺破「AI泡沫」的那根針出現了嗎？

華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站，為何成為全球矚目的焦點？

中國DeepSeek衝擊美股多收跌　輝達重挫逾16%市值蒸發近6000億美元

到日本過年要注意！大阪今天起戶外全面禁菸，違者罰1000日圓

關稅大棒真好用！哥倫比亞同意美軍機遣返移民，白宮宣布「暫緩關稅制裁」

韓國經濟引擎熄火？去年第四季成長幾乎歸零，學者稱「韓國競爭力已過頂峰」