DeepSeek幕後推手梁文鋒:從量化基金執行長到DeepSeek創辦人

2025-01-30 13:00

? 人氣

DeepSeek的競爭力在哪裡

DeepSeek表示,其模型R1是基於現有技術以及開源軟體開發的,這些軟體可以免費供任何人使用和分享。然而,《連線》(WIRED)雜誌報導稱,梁的對沖基金公司「幻方量化」囤積了大量的AI基礎晶片,即圖形處理單元(GPU)。根據《麻省理工科技評論》的估計,他獲得的晶片數量在10,000到50,000顆之間。

透過<Google新聞> 追蹤風傳媒

這些晶片對於構建能執行各種人類任務的強大AI模型至關重要,包括回答基本問題和解決複雜的數學問題。

2022年9月,美國宣佈禁止向中國出售這些高效能晶片,梁文鋒在接受中國媒體的訪問時指出,這是「主要挑戰」。

西方的主要AI模型估計使用了16,000顆專用晶片。但DeepSeek表示,他們的AI模型R1僅使用了2,000顆這樣的晶片,以及數千顆低級別晶片,這使得其產品成本更低。

根據開發者的說法,這款聊天機器人的建造成本僅為560萬美元,而ChatGPT的製造商 OpenAI去年花費了50億美元。

包括美國科技界億萬富翁埃隆·馬斯克(Elon Musk)在內的一些人對這一說法表示質疑,認為鑑於受到限制,該公司無法披露實際使用了多少先進晶片。

但專家表示,華盛頓的禁令既給中國的AI行業帶來了挑戰,也帶來了機遇。

雪梨科技大學副教授張越(Marina Zhang) 向BBC說:「這迫使像DeepSeek這樣的中國企業進行創新,讓他們在資源有限的情況下做更多的事情。」

她又補充道:「儘管這些限制帶來挑戰,但也激發了創造力和韌性,與中國實現技術獨立的更廣泛政策目標相一致。」

作為世界第二大經濟體,中國在大型科技領域進行了大量投資——從為電動車和太陽能電池板提供動力的電池到AI技術。

將中國打造成科技超級大國長期以來一直是習近平主席的雄心,華盛頓的限制是北京需要迎接的挑戰。

評價不一

DeepSeek的推出引發了美國主要科技股的拋售。美國市場在本週一收盤時,輝達股價已經暴跌17%,市值損失達 6000 億美元,根據彭博社報導,這是美國股市歷史上最大的跌幅。

風險投資家安德瑞森( Marc Andreessen) 在社交媒體X上表示,將DeepSeek-R1的出現視為 「AI的史普尼克時刻」,這指的是蘇聯率先發射的人造衛星。

但這款中國應用也引發了許多人的擔憂。

資深分析師孟斯特( Gene Munster)對BBC表示:「我仍然認為真相隱藏在表面之下。」他暗示的是DeepSeek披露的財務狀況。他還質疑這家初創公司是否獲得了補貼,以及其報告的數據是否準確。

「這款聊天機器人好得讓人很難相信。」

澳洲科學部長赫斯特(Ed Husic)則指出該產品的安全隱患。他向澳洲廣播公司表示:「有很多問題需要隨著時間的推移得到解答,關於質量、消費者偏好、數據和隱私管理。我會非常謹慎。這些問題需要仔細權衡。」

上週,OpenAI的阿特曼(Sam Altman)和甲骨文的艾利森(Larry Ellison)與川普一起宣布了聯合計畫「星際之門」( Stargate),承諾為美國的AI基礎設施提供高達 5000億美元的私人投資,並且在德州及其它地區建立數據中心,創造 10萬個新工作。(相關報導:華爾街日報》中國的DeepSeek如何在AI賽道追趕美國更多文章

隨著DeepSeek成為 AI 競賽中的另一強勁參與者,一些專家認為,這家公司的突然出現可能會引發對美國AI主導權及其計劃投資規模的質疑。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章