DeepSeek暴紅不單純？OpenAI質疑中國對手「竊取」平台智慧，才能創造低成本、高效能奇蹟 | 李靖棠

橫空出世的中國人工智慧（AI）新創公司發表DeepSeek平台，引起全球喧然大波，不只在歐美股市造成衝擊，也讓過去一年在AI熱潮中，已經佔有一席之地的企業，開始感到憂慮和警惕。其中，身為ChatGPT研發商的OpenAI，29日對外宣布、該公司已掌握相關證據，能證明DeepSeek存在侵權行為，指責對方在訓練與開發自己的模型時，使用OpenAI的專屬技術進行「蒸餾萃取」，成為自己平台的重要基礎養分。

《金融時報》（FT）引述OpenAI的說法，這個開發商質疑、DeepSeek極有可能利用所謂「蒸餾」（distillation）技術，透過從更強大且成形的AI模型，獲得輸出資料與數據，藉此就能在花費較低成本的狀態下，也能訓練出具有類似性能的模型。雖然公司並未透露更多細節，但是在ChatGPT服務條款上，明確禁止用戶「複製」其服務，或是利用詢問AI得到的結果，進行衍生性開發，製作出一款與OpenAI競爭的模型或平台，一旦被發現、這就屬於嚴重侵權。

訂閱風傳媒VIP會員，享有零廣告閱讀介面

透過<Google新聞>追蹤風傳媒

OpenAI says it has evidence China’s DeepSeek used its model to train competitor https://t.co/CzZG8yhQiE
— Financial Times (@FT) January 29, 2025

川普（Donald Trump）政府新任命的 AI 及加密貨幣政策負責人薩克斯（David Sacks），在接受《福斯新聞》採訪時明確表示懷疑，認為DeepSeek背後團隊，很可能涉及竊取智慧財產權。薩克斯表示，在AI 領域、有一種技術叫蒸餾，從一組已經成熟的模型中進行學習，再把得出的結果與知識吸收，重新組成自己的模組。在薩克斯看來，「有大量證據顯示DeepSeek 正是透過蒸餾OpenAI模型的知識，我認為OpenAI對此並不會開心。」但即便明確表達質疑，可薩克斯在整個訪問過程，都未提供具體證據。

DeepSeek近日發布的R1模型，表現非常優異，令市場及矽谷（Silicon Valley）投資人與科技公司都感到驚訝，甚至該模型的排名，與美國領先AI模型非常接近。而DeepSeek團隊宣稱，該公司僅使用2048 張輝達（Nvidia）H800 GPU和560萬美元（約新台幣1.84億元）支出，就成功訓練出這個擁有6710億參數的V3模型。這一成本遠低於OpenAI和Google 訓練類似模型的開支，令業界質疑，他們的模型是否曾利用OpenAI的GPT-4，輸出資訊作為平台的訓練數據。

2023年12月8日。在ChatGPT的Dall-E模型生成的影象前，一台手機螢幕上顯示著OpenAI的圖標。（AP）

畢竟在DeepSeek上線後，許多專家在測試中發現，這個新平台回應方式，與GPT-4高度相似，非常有可能是透過蒸餾取得基礎。《彭博》一則報導中則提到，有匿名知情人士聲稱，微軟（Microsoft）與 OpenAI 去年秋天曾啟動內部調查，發現一批疑似屬於DeepSeek的帳號，專門利用ChatGPT的API進行蒸餾取得資料，隨後官方一次查禁這些被懷疑的帳號，但兩家企業都並未對此做出回應。

業內人士透露，其實在人工智慧領域，使用「蒸餾」技術相當常見，OpenAI其實就有為開發者提供官方管道，提供他們進行蒸餾，藉此取得更好、更快的答案，但關鍵問題在，「當你是為了開發自家模型，私自未授權的狀態下進行蒸餾，這就涉及違規。」但即便存在違規風險，可無論是在中國或美國，許多AI實驗室或企業，都會利用既有的頂尖AI模型，進行詢問並取得輸出模組，藉此來訓練自家的模型，這種做法相當常見。

DeepSeek用極少的資源訓練出與西方科技巨頭並駕齊驅的AI模型，引發矽谷震撼。（美聯社）

加州大學柏克萊分校（UC Berkeley）專攻AI研究的博士生古普塔（Ritwik Gupta）表示，「新創公司和學術界，經常利用經過人類調整的大型語言模型（LLM），像是ChatGPT來協助訓練自己的模型，這樣就能免費獲得這些大平台砸下重金後調整的成果。」在他看來，如果 DeepSeek真的是使用這種方法，要想確實阻止此類行為，實際操作上會非常困難。

對於這種情況，OpenAI早就注意到，他們在聲明中指出，愈來愈多中國企業和其他競爭對手，一直在嘗試利用蒸餾手段，竊取AI模型的資料與數據，他們已採取應對措施，保護自家的智慧產權，甚至還想藉此機會，將AI模型上升到國家安全高度，呼籲要擴大與川普2.0政府的合作，「保護最先進的 AI 模型，防止競爭對手和他國獲取美國技術。」（相關報導：華爾街日報》這兩個加大伯克利分校博士生寫的AI排名網站，為何成為全球矚目的焦點？｜更多文章）

不過，當OpenAI考慮提告DeepSeek侵權之際，別忘了身為AI平台開發商的它，目前自身也面臨多起版權侵權訴訟，包含《紐約時報》（New York Times）和多位知名作家，先後控告 OpenAI在未經授權的情況下，使用其新聞報導與著作內容來訓練AI模型。