橫空出世的中國人工智慧(AI)新創公司發表DeepSeek平台,引起全球喧然大波,不只在歐美股市造成衝擊,也讓過去一年在AI熱潮中,已經佔有一席之地的企業,開始感到憂慮和警惕。其中,身為ChatGPT研發商的OpenAI,29日對外宣布、該公司已掌握相關證據,能證明DeepSeek存在侵權行為,指責對方在訓練與開發自己的模型時,使用OpenAI的專屬技術進行「蒸餾萃取」,成為自己平台的重要基礎養分。
《金融時報》(FT)引述OpenAI的說法,這個開發商質疑、DeepSeek極有可能利用所謂「蒸餾」(distillation)技術,透過從更強大且成形的AI模型,獲得輸出資料與數據,藉此就能在花費較低成本的狀態下,也能訓練出具有類似性能的模型。雖然公司並未透露更多細節,但是在ChatGPT服務條款上,明確禁止用戶「複製」其服務,或是利用詢問AI得到的結果,進行衍生性開發,製作出一款與OpenAI競爭的模型或平台,一旦被發現、這就屬於嚴重侵權。
OpenAI says it has evidence China’s DeepSeek used its model to train competitor https://t.co/CzZG8yhQiE
— Financial Times (@FT) January 29, 2025
川普(Donald Trump)政府新任命的 AI 及加密貨幣政策負責人薩克斯(David Sacks),在接受《福斯新聞》採訪時明確表示懷疑,認為DeepSeek背後團隊,很可能涉及竊取智慧財產權。薩克斯表示,在AI 領域、有一種技術叫蒸餾,從一組已經成熟的模型中進行學習,再把得出的結果與知識吸收,重新組成自己的模組。在薩克斯看來,「有大量證據顯示DeepSeek 正是透過蒸餾OpenAI模型的知識,我認為OpenAI對此並不會開心。」但即便明確表達質疑,可薩克斯在整個訪問過程,都未提供具體證據。 華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站,為何成為全球矚目的焦點?更多文章
DeepSeek近日發布的R1模型,表現非常優異,令市場及矽谷(Silicon Valley)投資人與科技公司都感到驚訝,甚至該模型的排名,與美國領先AI模型非常接近。而DeepSeek團隊宣稱,該公司僅使用2048 張輝達(Nvidia)H800 GPU和560萬美元(約新台幣1.84億元)支出,就成功訓練出這個擁有6710億參數的V3模型。這一成本遠低於OpenAI和Google 訓練類似模型的開支,令業界質疑,他們的模型是否曾利用OpenAI的GPT-4,輸出資訊作為平台的訓練數據。
![2023年12月8日。在ChatGPT的Dall-E模型生成的影象前,一台手機螢幕上顯示著OpenAI的圖標。(AP) 2023年12月8日。在ChatGPT的Dall-E模型生成的影象前,一台手機螢幕上顯示著OpenAI的圖標。(AP)](https://image.cache.storm.mg/styles/smg-800x533-fp/s3/media/image/2024/12/16/20241216-042213_U29228_M1015916_05b8.jpg?x7s4j4leP0rQtkQ24rO4PMbcfbwwdrog&itok=xvxe8PP6)
畢竟在DeepSeek上線後,許多專家在測試中發現,這個新平台回應方式,與GPT-4高度相似,非常有可能是透過蒸餾取得基礎。《彭博》一則報導中則提到,有匿名知情人士聲稱,微軟(Microsoft)與 OpenAI 去年秋天曾啟動內部調查,發現一批疑似屬於DeepSeek的帳號,專門利用ChatGPT的API進行蒸餾取得資料,隨後官方一次查禁這些被懷疑的帳號,但兩家企業都並未對此做出回應。