中國的DeepSeek因標榜低成本也能訓練出強大AI模型,顛覆AI訓練不能沒有精密昂貴晶片的刻板印象,引發科技類股恐慌,輝達27日收盤重挫17%,創美股上市公司史上單日最大跌幅。
● 美科技類股慘遭血洗
華爾街日報指出,以科技類股為主的那斯達克綜合指數(Nasdaq Composite)下跌3.1%;標普500指數(S&P 500)上週締造歷史新高後下跌1.5%。許多公司損失達雙位數。甲骨文(Oracle)股價下跌14%,美超微(Super Micro Computer)下跌13%,晶片製造商博通(Broadcom)重挫17%。
道瓊斯市場數據(Dow Jones Market Data)顯示,27日的市場大浴血讓美國股市蒸發約1兆美元。美股今天的跌勢堪稱突如其來的逆風,因為自川普當選以來美股即處於歷史高位,投資人押寶新政府親商政策,同時享受AI類股漲勢的紅利。
● DeepSeek是什麼
紐約時報指出,DeepSeek是由中國對沖基金幻方量化(High-Flyer)創辦與經營的新創公司,目標是打造出與OpenAI的ChatGPT、Google的Gemini等相近的人工智慧(AI)科技。
DeepSeek在中國以吸引年輕AI人才著稱,提供高薪和參與尖端研究計畫機會,招攬頂尖大學的研究人員,幻方量化與DeepSeek均為中國企業家梁文鋒所經營。
● DeepSeek何以如此震撼
DeepSeek去年12月26日推出DeepSeek-V3這款大型語言模型,性能已可與OpenAI和Google等美企旗下優秀的聊天機器人媲美,單這點已讓外界驚艷。然而DeepSeek在一份說明技術構建的研究論文裡稱他們訓練AI所用晶片數量遠少於其他美企後,猶如引發地震。
全球一些頂尖企業用超級電腦訓練聊天機器人時動輒得用上至少1.6萬片晶片,然而DeepSeek工程師們說他們僅使用約2000片輝達(Nvidia)晶片。
此外,自從2022年底OpenAI掀起旋風以來,「不動輒重砸數十億美元沒法訓練出強大AI系統」始終是主流觀點,也予人唯有像微軟、Google、Meta等科技巨擘才玩得起先進AI、輝達這類AI晶片廠將一片光明的印象。
然而DeepSeek稱他們僅花費約560萬美元和相對原始的運算能力訓練自家系統,這比Meta建構旗下最新AI所花資金便宜約10倍,引來AI產業反思是否真有必要砸天文數字的資金、AI產業是否將泡沫化等。