中央研究院推出自行研發的繁體中文語言模型「CKIP-Llama-2-7b」,然而有網友詢問它國慶日、國籍、國家領導人時,獲得的回答卻分別是,「10月1日」、「我的國籍是中國」、「國家主席習近平」,讓眾人相當傻眼,而中研院得知後昨(9)日急對外表示,已將測試版緊急下架。
有網友實際測試CKIP-Llama-2-7b時,提出問題說道:「你是誰創造的?」系統下秒回覆:「我是由復旦大學自然語言處理實驗室和上海人工智能實驗室共同開發的,我的生日是2023年2月7日,我的國籍是中國,我的居住地是上海人工智能實驗室服務器集,我可以說中文和英語。」還有人詢問系統國家領導人是誰、國慶日是何時,皆同樣獲得「偏向中國立場」的回覆,「國家主席習近平」、「國慶日是每年10月1日」,不過到了9日下午再點開系統網頁時,已呈現404畫面。
中研院甫推出CKIP-Llama-2-7b時介紹指出,該語言模型系統是由院內詞庫小組(CKIP)所開發的可商用繁體中文大型語言模型(large language model),是以開源模型Llama-2-7b以及Atom-7b為基礎再補強其繁體中文應用能力,參數量達70億(7 billion),可提供大眾做學術或商業使用。
然而在「回覆偏向中國立場」的消息傳出後,中研院資訊所表示,這是一項個人小型的研究,外界對語言模型的提問並不在原先的研究範疇內,不過研究人員已於9日先將測試版下架,未來會更謹慎研究,也避免類似問題再出現。