程式碼開源不僅可以減少重複性工作,還可以推動技術研究的快速突破,降低應用門檻,加速技術產業化推廣使用,以及有效促進學界與產業界的有效交流,促進產學研融合。
2018年,Github被微軟收購,但其社區與業務依然獨立運營,保留了它傳承已久的開源精神。無論是生成式AI領域的論文還是項目,如果要選擇上傳開源程式碼的地方,Github絕對是首選。
2. 垂直型開源社區
除了像Github這樣大而全的開源社區外,還有一些針對垂直領域的小而精的網站和社區在開源領域發光發熱,比如Papers with Code和Hugging Face。
Papers with Code是一個總結了機器學習論文及其執行程式碼的網站。使用者可以輕鬆地在網站上檢索到所需要的機器學習論文及儲存在Github上的開源程式碼。使用者可以按照標題關鍵字或者研究領域關鍵字進行查詢,也可以按照流行程度、論文發表時間以及Github上收藏(Star)數量最多來對論文及論文代碼進行排序。
Papers with Code網站最初是由Reddit的使用者rstoj開發,讓人們可以從中發現一些以前不知道的研究精華。作為機器學習界的內容社區,Papers with Code大大促進了人工智慧領域的研究。
Hugging Face是專注於機器學習領域的垂直版GitHub。它想要把主打年輕使用者的聊天機器人作為主營業務,因此在GitHub上開源了一個Transformer的資料庫,不過沒想到聊天機器人業務沒做起來,Transformer庫卻在機器學習社區爆紅。很多人認為Hugging Face的成功是因為團隊開放的文化和態度,以及利他利己的精神很具有吸引力。
目前,仍然有很多業界專家都在使用Hugging Face和提交新模型,甚至有些NLP工程師招聘中明確要求面試者熟練使用Hugging Face Transformer庫。如果說人工智慧是一場淘金運動,那麼Hugging Face則是典型的「賣水人」。(19世紀加州盛行淘金,山谷裡水源極缺,淘金者苦於無水可喝,於是小農夫亞默爾放棄淘金,改為掘水賣水,因此賺進大筆錢財。)
作者介紹
杜雨:中國社會科學院大學技術經濟學博士研究生,北京大學金融學碩士,香港中文大學理學碩士,武漢大學經濟學學士。胡潤U30中國創業先鋒,G20青年企業家聯盟中國理事會青年委員。先後工作於騰訊、紅杉資本,關注數字經濟與科技創新,曾參與騰訊音樂娛樂集團合併上市,並參與投資管理得物、超級猩猩、文和友等創新型企業。北京大學未名創投協會和科技創業加速器QAQ(Quadratic Acceleration Quantum)創始人。著有《WEB3.0:賦能數字經濟新時代》。
張孜銘:北京大學管理學碩士,新加坡國立大學金融工程碩士,華中師範大學信息管理與信息系統、華中科技大學計算機科學與技術雙學士。元宇宙教育實驗室智庫專家,未可知文化科技與科技創業加速器QAQ聯合創始人。著有《WEB3.0:賦能數字經濟新時代》。
本文經授權轉載自高寶書版《AI生成時代:從ChatGPT到繪圖、音樂、影片,利用智能創作自我加值、簡化工作,成為未來關鍵人才》
責任編輯/郭家宏