DeepSeek暴紅不單純?OpenAI質疑中國對手「竊取」平台智慧,才能創造低成本、高效能奇蹟

2025-01-29 15:08

? 人氣

DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型,引發矽谷震撼。(美聯社)

DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型,引發矽谷震撼。(美聯社)

橫空出世的中國人工智慧(AI)新創公司發表DeepSeek平台,引起全球喧然大波,不只在歐美股市造成衝擊,也讓過去一年在AI熱潮中,已經佔有一席之地的企業,開始感到憂慮和警惕。其中,身為ChatGPT研發商的OpenAI,29日對外宣布、該公司已掌握相關證據,能證明DeepSeek存在侵權行為,指責對方在訓練與開發自己的模型時,使用OpenAI的專屬技術進行「蒸餾萃取」,成為自己平台的重要基礎養分。

透過<Google新聞> 追蹤風傳媒

金融時報》(FT)引述OpenAI的說法,這個開發商質疑、DeepSeek極有可能利用所謂「蒸餾」(distillation)技術,透過從更強大且成形的AI模型,獲得輸出資料與數據,藉此就能在花費較低成本的狀態下,也能訓練出具有類似性能的模型。雖然公司並未透露更多細節,但是在ChatGPT服務條款上,明確禁止用戶「複製」其服務,或是利用詢問AI得到的結果,進行衍生性開發,製作出一款與OpenAI競爭的模型或平台,一旦被發現、這就屬於嚴重侵權。  

川普(Donald Trump)政府新任命的 AI 及加密貨幣政策負責人薩克斯(David Sacks),在接受《福斯新聞》採訪時明確表示懷疑,認為DeepSeek背後團隊,很可能涉及竊取智慧財產權。薩克斯表示,在AI 領域、有一種技術叫蒸餾,從一組已經成熟的模型中進行學習,再把得出的結果與知識吸收,重新組成自己的模組。在薩克斯看來,「有大量證據顯示DeepSeek 正是透過蒸餾OpenAI模型的知識,我認為OpenAI對此並不會開心。」但即便明確表達質疑,可薩克斯在整個訪問過程,都未提供具體證據。  (相關報導:華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站,為何成為全球矚目的焦點?更多文章

DeepSeek近日發布的R1模型,表現非常優異,令市場及矽谷(Silicon Valley)投資人與科技公司都感到驚訝,甚至該模型的排名,與美國領先AI模型非常接近。而DeepSeek團隊宣稱,該公司僅使用2048 張輝達(Nvidia)H800 GPU和560萬美元(約新台幣1.84億元)支出,就成功訓練出這個擁有6710億參數的V3模型。這一成本遠低於OpenAI和Google 訓練類似模型的開支,令業界質疑,他們的模型是否曾利用OpenAI的GPT-4,輸出資訊作為平台的訓練數據。

2023年12月8日。在ChatGPT的Dall-E模型生成的影象前,一台手機螢幕上顯示著OpenAI的圖標。(AP)
2023年12月8日。在ChatGPT的Dall-E模型生成的影象前,一台手機螢幕上顯示著OpenAI的圖標。(AP)

畢竟在DeepSeek上線後,許多專家在測試中發現,這個新平台回應方式,與GPT-4高度相似,非常有可能是透過蒸餾取得基礎。《彭博》一則報導中則提到,有匿名知情人士聲稱,微軟(Microsoft)與 OpenAI 去年秋天曾啟動內部調查,發現一批疑似屬於DeepSeek的帳號,專門利用ChatGPT的API進行蒸餾取得資料,隨後官方一次查禁這些被懷疑的帳號,但兩家企業都並未對此做出回應。

喜歡這篇文章嗎?

李靖棠喝杯咖啡,

告訴我這篇文章寫得真棒!

來自贊助者的話
關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章