這種將歷代文籍整理消化、融會貫通過後的知識庫讓後世可以輕易地對如下的歷史疑問旁敲側擊、追根究底:孔子問過老子什麼問題?老子的回答對後世儒教有何影響?李白有提點過杜甫嗎?杜甫的詩風有因此改變嗎?中國歷史上有名的猶太裔人物為何?他們對猶太教徒逐漸被中國文化同化持什麼態度?徐福到底有沒有到過日本?鄭和的回教徒背景與他能成為七下南洋的世界級航海家有啥關係?也就是說,大型語言模型技術藉由積極梳理所有歷史文字,廣泛連結相關歷史資訊,因而大大豐富擴展了原來歷史典籍的文化深度與廣度。
除了協助解析歷史文物的來龍去脈與文化意涵以外,歷史文化保存的最高境界應是提煉萃取用於製作文化遺產的底層技能(skill),並將這些技能代代傳承下去。譬如說,保存唐詩的最高境界不僅是讓後人能理解它們的寓意或欣賞它們的藝術美感,還可以是進一步主動擷取唐代詩人的各種作詩技巧,進而運用這些技巧創作出格式相同、質地類似,但情境可隨後人任意指定的現代唐詩。只要有足夠的唐詩及其白話文語譯作為語料,現代大型語言模型很有機會藉由精調訓練鍛煉成可以媲美李白杜甫的機器詩人。
同樣的手法也可以應用於其他藝術形式,如李清照的宋詞、關漢卿的元曲,張大千的潑墨畫、顏真卿的書法、朱銘的木雕,甚至莫札特的古典樂等。一旦如上所述的大型語言模型成功開發出來,它們不但將帶給歷史文化保存翻天覆地的變化,也將開創無際藍海的商業新契機!
*作者為清華大學合聘教授,本文原刊《奔騰思潮》,授權轉載。