中共的言論審查,可能形塑人工智慧生成內容的未來

2023-03-22 12:00

? 人氣

2023年3月16日,百度創辦人、董事長兼首席執行官李彥宏演示「文心一言」的能力。(美聯社)

2023年3月16日,百度創辦人、董事長兼首席執行官李彥宏演示「文心一言」的能力。(美聯社)

透過<Google新聞> 追蹤風傳媒

當人工智慧遇上中國政權的資訊控制,足以扭曲國際資訊流通

ChatGPT是以人工智慧驅動的聊天機器人,由美國公司OpenAI製作,才上線數個月,就已經吸引上千萬名用戶;上線之後,這項技術的一個版本,也已經整合進微軟搜尋引擎Bing的有限預覽版中。現在,許多科技作家開始猜測,人工智慧輔助的搜尋引擎,可能會如何影響美國科技巨頭Google和微軟之間的競爭。人們採用ChatGPT之快速,也代表著一個更大的趨勢:雖說人工智慧的工具在近年來已經愈趨熱門,但有人主張,從2023年起,人工智慧將在人們的日常生活中更加醒目。

而任何人若要檢驗人工智慧的設計、運用和影響,就必須認真考慮中國的情況。在中國,人工智慧驅動的工具,已經廣被用於監控與政治有關的內容、審查言論,以及監視大眾。而科技公司在中國共產黨的要求下所開發的各種新作法,隨著全世界進入人工智慧整合的新階段,都可能影響中國以外的網路使用者、政策制定者和各家公司。

在新的一年,以下這幾項關乎人工智慧與中國的情勢,值得特別關注:

1. 關乎在中國「人工智慧生成內容」本身的審查

演算法工具在訓練時使用的資料,會直接影響演算法工具本身;因此,對於政治、社會與宗教議題,中國既然有言論審查,中國的人工智慧生成內容,就幾乎必然會受到這些審查的影響──已有證據顯示,這件事情已經發生了:

中國的資訊既被嚴格審查,又充斥政府宣傳,因此,如果機器學習工具的資訊來源,受限於中國所謂的防火長城,那麼,中國資訊的各種遺漏與偏誤,都將反映在這項工具的產出之上。舉例而言,羅伯茲(Margaret Roberts)和楊(Eddie Yang)在2021年的研究,發現以百度百科條目訓練的自然語言處理演算法,其產出內容的觀點,會不同於以全球性、未經審查的中文維基百科訓練的演算法。以全球資料訓練的演算法,會以正面的方式分析「選舉」、「民主」等詞彙,或者將之與「穩定」等名詞聯結;相對地,以百度百科訓練的演算法,則會正面評估「監控」、「中國共產黨」等詞彙,而「民主」等單詞反而會與「混亂」這樣的負面詞彙連結。

此外,人類也可能在機器產生內容之後再行干預,進而也造成人工智慧系統內含有言論審查。中國科技巨頭百度的文字圖像生成工具ERNIE-ViLG才剛上線,異議藝術家巴丟草和其他用戶就馬上發現當中的錯漏與人為操縱,而一篇九月在《麻省理工科技評論》上發表的研究,則描繪出審查的部分輪廓:沒有關於天安門的圖像,沒有中國的領導人們,也沒有「革命」或「翻牆」(比喻使用反審查工具瀏覽被封鎖的網站)等詞彙。

關鍵字:
風傳媒歡迎各界分享發聲,來稿請寄至 opinion@storm.mg

本週最多人贊助文章