中國AI大模型新創公司DeepSeek(深度求索)1月20日免費開源的一款 DeepSeek-R1推理模型震驚了科技界和政界。該公司稱這款新的AI模型性能足以媲美美國頂尖產品,但投資成本卻低得多——僅557.6萬美元,是OpenAI GPT-4o模型訓練成本的不到十分之一。該公司還稱,它使用是晶片是輝達相對低端的晶片及其他低端進口晶片。
DeepSeek的這款AI聊天應用迅速登頂蘋果中國和美國應用商店免費APP下載排行榜,同時引發市場對美國在AI領域競爭力的擔憂、對美國企業投入天量資金研發AI合理性及這些公司發展前景的質疑,以及對美國對中國的晶片出口管制究竟有沒有效的質疑,令美國科技公司股價大幅下挫。美國總統川普形容DeepSeek為美國業界「敲響警鐘」,並提醒美國要「全力專注於在競爭之中取勝」。
對DeepSeek成本與晶片的質疑
不過,在一些媒體和專家把DeepSeek的「橫空出世」稱為AI界的「史普尼克時刻」之際,也有聲音質疑DeepSeek所公布的開發成本以及所用晶片的規格與數量。
上周,美國人工智慧數據服務公司Scale AI首席執行官汪滔(Alexandr Wang)在接受 CNBC 採訪時對 DeepSeek的說法表示懷疑,稱「這款產品的背後,可能使用了數萬顆Nvidia(輝達)的H100晶片」。他說,「DeepSeek顯然擁有50,000顆H100晶片,但他們顯然不能公開這些信息,因為那會違反美國的出口管制。」汪滔沒有為他的說法提供證據。
億萬富翁埃隆·馬斯克支持對DeepSeek持懷疑態度的人。他在X上有關亞歷山大·王上述說法的帖子下跟帖寫道:「顯然」(Obviously)。
輝達(Nvidia)的H100晶片是目前市場上最先進的AI訓練晶片之一,但根據美國政府的出口管制政策,H100晶片是不能向中國公司銷售的。華爾街日報》DeepSeek崛起引發大哉問:AI的價值究竟在哪裡?更多文章
DeepSeek蒸餾提煉違反OpenAI條款?
DeepSeek也被一些技術專家懷疑其模型可能從美國先進的模型中學習到了部分成果,即採用了所謂的「蒸餾技術」。該技術是指通過從更成熟、更強大的人工智慧模型中提煉數據來訓練新的AI模型,由舊模型評估新模型得出的答案的品質,從而有效地轉移舊模型所掌握的學習成果。這意味著新模型可以從舊模型中獲益,而無需承擔構建舊模型所投入的大量時間、算力等成本。
1月29日,OpenAI稱,發現有證據表明DeepSeek使用OpenAI的專有模型來訓練自己的模型,並暗示這可能違反了OpenAI的服務條款。不過,OpenAI沒有進一步列舉掌握了哪些證據。OpenAI的服務條款規定,用戶可以使用OpenAI的API輸出接口將其AI技術與自己的應用程式相結合,但禁止用戶「複製」其任何服務或「使用其輸出來開發與OpenAI競爭的模型」。用蒸餾輸出構建競爭模型涉嫌違反 OpenAI服務條款。OpenAI表示,它將與美國政府合作保護美國技術,但沒有詳細說明如何合作。