繞開輝達護城河 陸媒:DeepSeek準備改配中國國產GPU晶片

2025-02-03 09:36
12,049人氣
中國媒體報導,只要有足夠擅長寫PTX(Parallel Thread Execution)語言的內部開發者,就能讓中國開發的AI模型更容易適配中國國產GPU晶片,這讓美國AI巨頭們感受到極大的威脅。(取自X社群)

中國初創企業深度求索(DeepSeek)在研發大模型時繞過了輝達的軟硬體整合技術「統一計算架構」(CUDA)這道AI技術護城河,這種用新的演算法高效利用硬體層面加速,能提高模型效果。據中國媒體《快科技》和《騰訊網》報導,只要有足夠擅長寫PTX(Parallel Thread Execution)語言的內部開發者,就能讓中國開發的AI模型更容易適配中國國產GPU晶片,這讓美國AI巨頭們感受到極大的威脅。

據中國媒體《快科技》報導,DeepSeek繞過了輝達的計算架構CUDA,北京航空航太大學黃雷副教授受訪表示,繞過CUDA意味著DeepSeek可以直接根據GPU的驅動函數做一些新的開發,從而實現更加細微性的操作。

黃雷指出,DeepSeek在多節點通信時繞過了CUDA,直接使用「平行線程執行代碼」(Parallel Thread Excution, PTX),其最多只能實現以演算法的方式來高效利用硬體層面的加速,一旦速度變得更快,這就意味著別人的模型要訓練10天,而DeepSeek只需要訓練5天,那麼就能給模型喂更多的資料,即能讓模型在同等時間內看到更多的資料,間接提高模型的效果。

因此,透過PTX雖然可以進行更多專門的最佳化調整,但缺點是很難維持穩定,需要人力大量除錯,因此也顯示出Deepseek工程師的設計功力。

報導說,Deepseek的出現,打破了矽谷巨頭在人工智慧競爭中的軍備競賽局面,AI 開發或許不一定非要追求最強晶片和龐大晶片數量,透過精細的程式設計也能讓低規設備跑出高效結果,這可能也是前日美國科技股市震盪的主要原因。 (相關報導: 王毅用「這4字」開嗆盧比歐 如何翻譯讓西方媒體傷透腦筋 更多文章

報導指出,DeepSeek擁有一些擅長寫PTX語言的內部開發者,假如它之後使用中國國產GPU,其在硬體適配方面將會更得心應手,其只要瞭解這些硬體驅動提供的一些基本函數介面,就可以仿照輝達GPU硬體的程式設計介面去寫相關的代碼,從而讓自家大模型更加容易適配國產硬體。

現正熱映中
更多文章
從貧民窟少年到韓國總統!李在明發表勝選演說:必將克服內亂,竭盡全力復甦經濟
韓國總統大選》出口民調結果篤定當選,李在明走出住處表態:我將不負國民所託!
陳歐珀涉賄 黃揚明曝「身邊人」提供黑資料:不掛看板這案子就不會辦
「民進黨廢監院立場早變調」 林濁水:柯建銘領導走到這步真是荒謬與悲哀
「鮮乳」變專有名詞!2026年起取得標章才能標示 違者最高罰400萬
韓國大選出口民調:40歲哈佛選將僅獲7.7%選票,李俊錫侮辱女性言論挨批
台幣強升8%!阮慕驊示警不利低EPS公司:未來選股「這項指標」更重要
去年營收破31億新高!這間旅行社除了擴展包機、包船,還要如何深耕市場?
嘆邵琇珮被折磨 ​柯文哲要「公訴檢察官別淌渾水」:起訴書誰寫的,我跟他對戰
韓國大選出口民調:李在明獲得青壯年和女性選民青睞,以51.7%得票率勝出
為何國民黨反罷連署1席未成?黃光芹曝慘淡統計表:只是朱立倫的問題嗎?
北京觀察》中美日內瓦共識生變?川普怒指北京違約,中國反控華府背信
新冠死亡率是流感的9倍?林氏璧詳解數據:比較基準不一樣
保單扣押修法》立院三讀 4類保單有望解禁、專家籲金管會速做此事
爭議擴大!網傳連持有「台胞證」都會被註銷台灣身分?陸委會「3點說明」緊急滅火
台幣狂升,央行6月再出招?帥過頭提1事嗆「楊金龍下台」:只有台灣不一樣
六福股東會》終結8年虧損!去年營收增5% 推全體員工加薪留才
賴清德軍禮迎馬紹爾總統 兩人冒雨同行 林佳龍曝背後文化寓意
藍白通過「2028無煤中火」決議 江啟臣表態「支持」:減碳無煤是國際趨勢
表彰​藝文教育卓越貢獻 富邦獨董陳建宏獲頒教育部獎狀