人工智慧機器人完全取代人類的日子或已不遠。美國科技鉅子馬斯克創辦的非營利人工智慧研發組織「開放AI」近期公佈了人工智慧文字產生器GPT2,不僅能寫新聞還能寫小說,且成果與真人撰寫的作品幾乎看不出差異。英國《衛報》14日報導,開放AI團隊憂心GPT2遭濫用,成為製造假新聞的工具,罕見決定暫時不公開完整的研究模型,僅發布技術論文和一小部分的模型範例,提供研究人員做實驗。
「開放AI」(Open AI)是一間由特斯拉(Tesla)創辦人馬斯克(Elon Musk)、創投公司Y Combinator創始人奧特曼(Sam Altman)等多名美國矽谷大亨共同資助創辦的非營利人工智慧實驗室。該團隊在本月14日發布新一代的大型語言模型GPT2,該模型有15億個參數,利用800萬頁的網頁作為訓練資料,只要給定模型一個單字或是一個句子,GPT2就可以根據文字的語義、風格,續寫出與高度擬真且有條理的文句。
自動接續文章風格與主題 GPT2驚人的「創作」結果
《衛報》(The Guardian)公布一段GPT2的實測影片,編輯輸入喬治歐威爾小說《1984》裡的第一句:「四月裡,天氣晴朗寒冷,鐘敲了十三下」(It was a bright cold day in April, and the clocks were striking thirteen),系統立刻辨識出文字蘊涵的未來科幻小說風格,接續寫下:
「我開著車在往西雅圖新工作的路上,我加了油,將鑰匙插入,讓車子運轉。一百年後的今日,我想像著那天會是什麼樣子。2045年,我在中國貧困農村的一所學校擔任老師,從中國歷史和科學史開始教起。」
“I was in my car on my way to a new job in Seattle. I put the gas in, put the key in, and then I let it run. I just imagined what the day would be like. A hundred years from now. In 2045, I was a teacher in some school in a poor part of rural China. I started with Chinese history and history of science.”
GPT2產生的句子,不僅沒有過去AI系統前後語意不一致或語法錯誤的問題,還能立即產生出相符的文字風格與主題。GPT2輸出的文字的質量和潛在用途,都超越以往人們想像的AI寫作範圍。
《衛報》再以英國脫歐新聞實測發現,GPT2能夠產生具高度合理性的新聞文章,其產生的內容引用了反對黨工黨領袖柯賓(Jeremy Corbyn)的發言和首相發言人的回應,並提到愛爾蘭邊境問題。
AI 太會寫 研究人員擔心遭惡意濫用
「開放AI」研究主任艾莫代(Dario Amodei)指出,GPT2的訓練數據資料庫比先前的AI多了15倍,利用了超過1000萬篇的文章,這些文章來自社群網站Reddit,數量高達40 GB。大量訓練資料直接影響了GPT2產生內容的質量,讓GPT2更能理解文本的語意、風格,目前該模型能夠在機器翻譯、回答問題、閱讀理解、總結段落等語言任務中生成與段落一致的文字內容。
We've trained an unsupervised language model that can generate coherent paragraphs and perform rudimentary reading comprehension, machine translation, question answering, and summarization — all without task-specific training: https://t.co/sY30aQM7hU pic.twitter.com/360bGgoea3
— OpenAI (@OpenAI) 2019年2月14日
GPT2高度擬真的內容也使得研究單位決定暫時不公開完整的研究模型,開放 AI政策總監克拉克(Jack Clark)表示,團隊也在研究有心人士會如何惡意濫用GPT2。研究團隊公布部分的成果是為了讓主流社會能有心理準備,面對未來一兩年內AI技術進步可能帶來的衝擊。