剛開始記者們半開玩笑地對機器人會搶走自己的飯碗表達憂心,後來大家熱議機器人寫的足球賽新聞和人寫的差距多大,再後來—現在,對AI的關注又變了。
人工智能將如何拓展、重塑新聞編採製作流程中的哪些環節?以前有哪些難以想像或未曾出現的設想能借助AI的能力實現?又有哪些環節確實可行且正在取代人工?
在這個自由揮灑想像力的空間中,AI在新聞編輯室可以發揮什麼作用?
機器跟人搶獨家新聞?
人工智能跟人類爭普立茲獎?其實1988年就發生了。《大西洋月刊》記者比爾·戴德曼(Bill Dedman)在電腦幫助下檢索梳理了海量的住房抵押數據,寫出系列報導揭露這一行的隱形種族歧視,作品獲當年普立茲獎。當然,這可以算作機器奪獎。
機器跟人搶獨家新聞?這事4年前有人預言過:會寫程式的記者將能搶先報出獨家新聞,搶頭條。
機器人工程師約翰·基弗(John Keefe)今年1月在哈佛大學尼曼新聞實驗室(Nieman Lab)2018行業預測中斷言,這件事今年就會發生。他說,記者將運用AI搶得獨家新聞。
這跟機器人寫足球、財經消息不同。那更多是數據分析整理,然後用自然語言程式組合成文。搶獨家消息是通過機器學習技術識別、發掘出人類單憑自己的大腦難以捕捉到的重要事實和真相。
至於未來的媒體編輯室是否由AI主宰,或者人類和機器聯合執掌,現在難有定論。
可以肯定的是,適用於工、農業的生產邏輯,在相當程度上同樣適用於媒體內容生成:搜集資料、整理數據、核查事實、版面校對等,這些工序大部分可以、也肯定會交給AI,編輯記者則可以更集中心力於創意、創新。
人算不如機器算
人機合作已有探路先驅。美國《大西洋月刊》記者麥吉爾(Andrew McGill)把一項枯燥而至關重要的任務交給了機器人助手,@TrumpOrNot,讓它分辨美國總統川普的推特帳號下哪些是他本人發的,哪些是助手代勞的。
這個助手利用機器學習和自然語言處理技術,把川普新發的推特文字跟數據庫中的文檔資料對比,然後做出比較準確的判斷。
麥吉爾在2017年3月發表了自己的實驗結果時寫道:
「機器算法找到的那些最有助於分辨一則推特訊息出自川普之手還是工作人員之手的線索,真的很有意思。大部分不是文字,而是特別的拼寫和標點符號。」
比如,川普發的推特更頻繁出現自己的推特名「@realDonaldTrump」,更喜歡用「媒體」這個詞,但顯然不愛用「#」,而手下代發的推特訊息裡這個符號更常出現。
麥吉爾承認自己這個助手的知識庫需要不斷更新,尤其是作為識辨指標的關鍵詞、習慣和特點。
AI進駐媒體 整理海量資訊
專注於人工智能領域發展的科技網站TechEmergence,對人工智能在幾家主要西方媒體的應用做了梳理,勾勒機器人進駐編輯室趨勢的藍圖。
BBC的人工智能機器人叫「榨汁機」(Juicer )。它的任務是把海量數據,包括每日新聞、專題報導、影片、其他媒體的消息、政府部門和互聯網信息等等,以一種聰明智慧的方式聯結起來,既方便調用,又暗藏互相貫連的邏輯。
「榨汁機」2012年上工,每天引入850個新聞機構的RSS訊息推送,整合處理數據,把BBC和其他媒體的新聞報導分揀出來,然後貼上相應的語義標籤,分成4類歸檔:組織機構、地點、人物、事物。
這樣,記者要查找有關川普總統的最新消息,或者AI領域動態的資訊,「榨汁機」就會迅速上網搜索,然後給出一個相關內容的清單。
這還比較枯燥。不久的將來,「榨汁機」的性能提高後,還會更貼心,讀者鼠標在某個字詞上停留兜圈片刻,它就能生成一個彈出窗口,提供相應的資訊。作為電視廣播媒體,BBC還在訓練它在影片環境下彈出相關的資訊。
《紐約時報》:AI辨識語義、管理評論區
2015年,《紐約時報》大樓內來了個名叫「編輯」(Editor)的AI。它的任務是簡化記者編輯的工作流程。記者寫稿時可以用標籤來標明關鍵詞、標題或主題。隨著時間推移,數據積累到一定程度後,機器編輯就能自動識別這些標籤的語義,找到一段文字中最關鍵的部分。這樣,記者查資料或核對事實就很便捷,人物、地點、事件、時間,分門別類,井然有序。
人工智能在那兒的另一項任務是管理讀者評論區。它將來可能要承擔的是目前共有14個人負責的工作,主要是每天分揀查閲11,000條讀者評論。該報開設評論區功能的文章只佔全體10%,如果用AI機器管理,則可以有更多文章開放評論區,強化互動,並節省開支。這個軟件叫Perspective API,可以迅速分揀整理讀者評論,使讀者更容易檢索到自己感興趣的評論並展開討論,或者避開無聊的殭屍留言。
這是機器搶人飯碗的一個例子。
「自動化新聞」(Automated Journalism)也稱「機器人新聞寫作」,使用的寫稿軟件是Heliograf。它在2016年里約奧運會上初次上場。它對源源不斷的數據分析整理後,把新資訊跟事先制定的新聞版型裡的對應詞句配對,然後組成新聞稿,發表在不同的平台。要是發現數據裡有異常,它還會提醒記者注意。也就是說,整個里約奧運會期間,寫稿機器人承擔了大量有關分數和獎牌數的即時報導,記者則可以專注採寫其他內容。
新聞自動化有兩層含義,一是數量,二是客製化。
比如關於英國脫歐,機器人寫手可以生成面向英國讀者、中國讀者或其他國際讀者群的不同版本;關於股市動態的報導,可能會有一段專門為你訂製:大盤總體向上,但你上周要是沒有賣那些IBM股票,那你的投資組合資產今天會有這麼多。
換句話說,機器人可以在萬里之外寫出比本地記者更接地氣的新聞報導,或者把一條枯燥乏味的消息變成熱搜榜上人人關注的新聞。
路透:AI調動數據,隨時更新資訊視覺化網站
《路透》2016年跟語義辨識技術公司Graphiq合作,研發智能型的新聞發表軟體,它帶有自由互動的資訊視覺化功能,涵蓋範圍寬廣多元,包括娛樂、體育和新聞等。這個發表軟體可以從《路透》的開放媒體平台上調取數據。這些數據嵌入發表器網站後,全球數據化程式會即時更新。
美聯社:語義辨識、人工智能分析、自動化新聞
「自動化」的另一個客戶是《美聯社》。早在2013年,美聯社就開始運用人工智能來處理體育和財經數據,生成新聞稿。現在美聯社的機器人叫NewsWhip,負責追蹤、預測社群媒體平台上的趨勢。除了跟蹤新聞報導,它還可以向記者提供及時或歷史記錄的分析結果。有了這個助手,新聞稿的數據凖確性提高,錯誤減少,記者編輯更能精準掌握新聞時事脈動。
《美聯社》沒有用人工智能來撰寫長篇政治評論文章,但在用一款名叫Wordsmith的機器人來把企業獲利數據轉換成財經新聞。
Quartz:聊天機器人協助人機互動
關鍵詞:聊天、自然語言處理、新聞、話題。《Quartz》2016年獲得一筆資金成立機器人實驗室,為記者們開發各種自動化工具。這是對新聞媒體行業大趨勢的一種反應:新聞不但從紙面轉到桌面電腦、手提電腦、手機,不久的將來還將通過物聯網進入家庭和私人轎車。
簡而言之,就是通過聊天、語音和其他新穎渠道來實現人機互動。這個嘗試處於初期階段,但已經可以看出端倪。用戶輸入問題和要求,比如新聞事件、人物或地點,聊天機器人根據自己的理解提供相關的內容。
《Quartz》的目標是開發出能夠跟所有媒體平台流暢互動的機器人和人工智能。目前還沒有最後確定下一步怎麼走,但正在考慮的設想裡包括編輯室機器人,幫助記者為新媒體空間編寫新聞、生成數據。
英國《衛報》也引入聊天機器人,2016年在臉書帳戶上亮相,主要工作是幫助讀者選擇閲讀的版本、新聞推送時間,並負責推送;這項職務內容看來跟客服比較相似。
機器有人力不及之處,也有不及人腦之處。(BBC中文網)
中國採用「機器人」撰稿
自2015年騰訊財經頻道開始使用中國機器人寫稿以來,不少媒體人發現多了個機器人「同事」。
2015年 -
-
騰訊財經:9月10日發表了Dreamwriter新聞寫作機器人編寫的經濟資訊(《8月CPI漲2%,創12個月新高》)。
-
新華社:「快筆小新」11月開始為體育部、經濟信息部和《中國證券報》寫體育賽事及財經消息稿件。
2016年 -
-
網媒今日頭條:機器人「小明」(xiaomingbot)在2016年里約奧運會期間每天寫30多篇賽事短訊和賽場報導;
-
《錢江晚報》:微軟旗下人工智能機器人「微軟小冰」上線,在「浙江24小時」APP中開設「小冰機器人」專欄;
2017年 -
-
《南方都市報》和凱迪網:與北京大學計算機科學技術研究所聯合成立智媒體實驗室,推出寫稿機器人「小南」;
-
《華西都市報》:機器人「小冰」開設專欄「小冰的詩」,獨家發佈新作《全世界就在那裡》(外二首);
-
《廣州日報》:中國全國人大和政協兩會期間,寫稿機器人「阿同」、「阿樂」寫出了「政府工作報告熱詞分析」、「外交部部長記者會熱點問題分析」等多篇報導,還回覆了民眾關於兩會知識的提問;
-
《人民日報》:人工智能、語音機器人「小融」在春節期間開工,在人民網和其他社交媒體平台與網友互動;
除了這些隱形的AI寫稿程式之外,也有更全能、具備機器人外型的AI記者,如新華社的「i思」、《深圳特區報》的「讀特」、浙江衛視的「小聰」和香港大公文匯傳媒集團的「小寶」,可以出去採訪和錄製廣播電視節目。
人類與AI合作:截長補短
也許,未來比較合乎邏輯的延伸方向是人和機器各自揚長避短。機器人不以優美的文筆跟人競爭,而是在人的腦力無法企及的地方取勝,比如把一條重大訊息寫成幾篇視角獨到、見解深刻、分析精闢的報導,而且能夠迅速把這幾篇文稿個性化,生成數十萬個針對不同受眾的版本。
AI在各地的編輯室裡的職務內容正在不斷變化,從數據收集、整理和分析、交叉檢驗、查核事實,到寫稿、創作、編輯,再到重新定義新聞傳媒專業和行業,速度令人目眩。
新事物難免衝擊現狀,帶來新問題,試管嬰兒、複製人、基因編輯,無不在某些方面挑戰人類社會倫理。AI也不例外,不過這是後話了。