隨著全球各國紛紛加速部署資源發展本土AI實力,如鄰國已經建立了名為「文心一言」的簡體中文語言模型,台灣也必須加快腳步,建立自主的AI能力。如此不僅可以確保台灣的數據主權,也能提升台灣在未來AI競爭中的地位。
台灣有哪些自建的AI語言模型?美系、法系各佔一半
如今中研院和許多台灣業者,已開始積極投資發展自主的AI語言模型。以下是幾個值得關注的台灣自建AI模型:
1.TAIDE:由國科會支持,中研院執行開發的大型語言模型,具有豐富的中文知識和理解能力。TAIDE可用於各種以中文執行的文書任務,如自動摘要、寫信、寫文章、中翻英、英翻中等。
2. BreeXe:由台灣IC設計公司聯發科,取用法國開源語言模型Mixtral-8x7B模型,調校(fine-tuning)而成,採用擴充詞表技術,擁有增強的搜索生成功能(RAG)。BreeXe可望用於企業部署地端AI,用於內部知識管理等使用情境。
3. 白龍(Bailong-instruct 7B):由群創光電開發的大型繁中語言模型,以Meta的Llama-2-70B為基礎,加入繁中語料調校。它的特色是使用束帶嵌入技術(zip-tie embedding),大幅降低訓練所需算力,並強化繁體中文任務理解和表現。白龍可用於寫信、摘要生成、閱讀理解等任務。
4. 福爾摩沙(FFM-Llama 2):由華碩子公司台智雲,以法國超級電腦煉出的可商用、開源模型BLOOM為基礎,經過台智雲的預訓練、微調和人類回饋(RLHF)等三階段優化。福爾摩沙模型具有寫作、推理能力,對東南亞語系也有理解。
5. CaiGunn開講:由台灣AI新創APMIC(亞太智能機器)打造的在地化大型語言模型,結合了HPE和Intel的高端伺服器,內建多種提示(prompt)範例,可為企業提供節省人力和時間的資訊整理、客服回覆等服務。
上述官方和民間組織研發的AI語言模型,多建立於國外大型語言模型的基礎,而非自行建置。據林彥廷所述,這是因為台灣的技術人才遠遠短缺,因此遲遲無法跨越研發門檻。為此,風傳媒抽絲剝繭調查,要理解台灣距離自主建置AI語言模型,還有幾哩路?