Meta根據台語語音語料庫Taiwanese Across Taiwan,建立第一個福建話與英語雙向的語音翻譯基準資料集。Meta也將開放資料集原始碼、評估資料集和研究報告,鼓勵其他研究人員合作進行閩南語語音翻譯,一起推進相關技術。Meta表示,目前該計畫只能讓福建話跟英語者的使用者對話,而且每次只能翻譯一個完整句子,未來則希望推廣到各種語言的同步翻譯。
Meta打造福建話跟英語的翻譯系統時,由於沒有福建話的標準書寫系統,需要將福建話的語音轉譯成標準化的拼音符號。此外,也因為福建話沒有標準文字,若從零開始建立全新的翻譯資料內容將是一個十分辛苦的工作,也無法利用已經建好的各種語言資料庫。因此Meta將最接近福建話的中文資料庫作為中介,大幅改善建立人工智慧模型的效率。Meta認為,AI翻譯有助於打破在現實世界和元宇宙中的語言限制,未來所有語言都不再是人們相互理解的障礙,所有人都能進行順暢無阻的溝通。
陳鵬仁的高中同學、目前在康乃爾攻讀資訊科學博士班的侯宗佑在臉書上表示,陳鵬仁目前在Meta負責翻譯的演算法,雖然全家住在美國,仍用心尋找台語教材、讓小孩練習母語。侯宗佑指出,Meta翻譯技術是世界第一個直接「口語對口語」的翻譯系統,而且以開源方式供大家使用。也因為Meta先選了台語這個以口語為主的語言進行研發,往後即使不會寫台語書寫系統的人,也可以利用這個系統跟其他語言的人溝通,只要會講就可以了。