search
尋找貓咪~QQ 地點 桃園市桃園區 Taoyuan , Taoyuan

智媒時代的新聞生產:自動化新聞的實踐與思考

智媒時代的新聞生產:

自動化新聞的實踐與思考

作者

許向東,人民大學新聞學院副教授,人民大學新聞與社會發展研究中心研究員。

郭萌萌,人民大學新聞學院2016級碩士研究所。

本文為國家社科基金項目「數據新聞的理念、實踐及其人才培養模式研究」的階段性成果之一,項目批准號:16BXW018

2016年裡約奧運會對於體育界來說是各國運動員同台競技的盛會,而對於新聞界則是自動化新聞大顯身手的良機。在奧運會開幕之前,《今日頭條》就研發出了一款寫稿機器人Xiaomingbot,通過對接奧組委的資料庫,實時撰寫新聞稿件。騰訊財經繼續發力,其Dreamwriter在奧運會期間發布了3000多篇報道。而美國《華盛頓郵報》採用的是Heliograf,該軟體第一時間從運動數據公司stats.com採集相關信息,幾秒鐘即可生成並在Twitter上發布一條新聞,每天可以生成實時報道數十條(李駿,2016)。

一、自動化新聞在國內外的變革歷程

技術創新給新聞傳播帶來的變革從未停止過。人工智慧與大數據技術進入新聞生產領域,帶來了新聞發展的新模式。Web2.0之後媒體變革的起點是移動互聯網,但它更大的趨向是媒體智能化或智媒化(彭蘭,2016)。自動化新聞正是新聞生產智能化在現階段的體現。

(一)自動化新聞在國外的發展

目前,國外一共有11家公司負責為不同國家的新聞產品提供自動化內容生產的技術支撐,包括德國的AX Semantics,Text-On,2txt NLG, Retresco,Textomatic;美國伊利諾伊州的敘事科學公司(Narrative Science)和北卡羅來納州的自動化洞察力公司(Automated Insights);法國的Syllabs和Labsense;英國的Arria;俄羅斯搜索引擎Yandex主要應用於撰寫天氣和交通報道。7家公司以一種語言提供內容,其餘4家則提供多種語言服務。例如,德國公司AX Semantics提供多達12種語言的自動內容創建(Dörr,2016)。自動化撰稿軟體主要用於以數據為基礎的程式化報道,而新聞編輯室大多缺乏開發自動化寫作軟體的資源和能力,因此,新聞媒體會和上述技術公司在自動化新聞生產領域展開合作。

(二)自動化新聞在國內傳媒領域的應用

自動化新聞在新聞傳媒界起步較晚,但在傳統媒體和新媒體上均取得了進展。目前主要有四家媒體在進行自動化新聞的實踐,分別為騰訊財經的「Dreamwriter」、新華社的「快筆小新」、第一財經的「DT稿王」和《今日頭條》的「Xiaomingbot」。

2015年9月,騰訊推出自己的新聞寫作機器人「Dreamwriter」,發布國內首篇自動化新聞《8月CPI同比上漲2%創12個月新高》。同年11月,新華社推出的「快筆小新」,主要「供職」於體育部、經濟信息部和《證券報》,負責撰寫體育賽事報道和財經新聞。2016年5月,阿里巴巴與第一財經聯合推出「DT稿王」,在媒體、金融、電商、政府、體育、法律等需要基於邏輯寫作的領域發揮作用。2016年8月,《今日頭條》研發出了一款機器人(Xiaomingbot),這是一個基於文字直播數據進行新聞生成的系統。依靠先進的機器學習演算法,該系統能夠實時地從文字直播數據中進行語句篩選與融合,從而在體育比賽的任一時刻生成高質量賽事報道(刁毅剛、陳旭管,2016)。

騰訊Dreamwriter從2015年9月面世至今,已經經歷了四個版本的迭代,目前,Dreamwriter正處於第五個版本的探索階段,主要致力於開發大數據服務新聞生成和機器人智能演算法寫作。新華社「快筆小新」已經可以採集多位金融專家的微博,動態關注並採集他們發表的相關言論,對其相關內容進行關聯分析,分析結果作為素材供編輯記者采寫深度稿件使用。下一階段將結合UGC新聞來源認證技術,逐步提高機器人采寫UGC新聞的範圍,更好地為編輯記者服務(熊立波、鍾盈炯、林波,2016)。

二、自動化新聞的生產方式與生產流程

自動化新聞指的是在新聞生產過程中「在沒有或者有限的人類干預下,由預先設定的程序將數據轉化為新聞文本的自動演算法過程」(Matt Carlson,2015)。

(一)自動化新聞的生產方式

自動化新聞中常提的「機器人」實際上是一種稿件自動生成軟體,通過軟體應用實現機器取代人力,提高發稿的速度和數量。

目前,自動化新聞的生產方式主要有三種:一是利用結構化數據生成稿件。在掌握大量整合好、便於計算機讀取的結構化數據的基礎上,參照行業專家提供的計算公式、判別規則,在預先設置的新聞模板中生成新聞稿件,這種方式主要用於財經報道、體育報道和醫療衛生報道等;二是在挖掘用戶數據的基礎上生成個性化稿件。對用戶的閱讀內容、閱讀習慣等進行分析、挖掘,或者根據受眾自定義的標籤,將同一內容的信息整合成多篇角度不同、風格迥異的稿件,為用戶推送個性化產品,增強用戶黏性。三是利用記者數據模型智能化生成稿件。將採集到的文字、圖片、語音、視頻等素材以及其他背景資料,與某個記者的數據模型相結合,通過軟體運算自動生成符合該記者風格的稿件。

雖然現在的自動化新聞生產基本上是一種「人工模板」+「自動化數據填充」的模式,但是,隨著科技的發展,自動化新聞就有可能在新聞敏感、情感表達、深度分析及選題發現等方面日漸成熟。

(二)自動化新聞的生產流程

新華社「快筆小新」的寫稿流程可以分為三個環節:一是「採集清洗」,依託大數據技術對數據進行實時的採集、清洗和數據的標準化;二是「計算分析」,根據業務的需求設計相應的演算法模型對數據進行實時的計算和分析;三是「模板匹配」,根據計算和分析的結果選取合適的模板生成CNML(中文新聞信息置標語言)的稿件,並自動寫入到待編稿庫,編輯審核后再進行簽發。

騰訊Dreamwriter的寫作流程主要包括五個環節:首先通過購買或自己創建資料庫;然後讓Dreamwriter學習資料庫內的各項數據,並生成相對應的寫作手法;接著針對與資料庫相關聯的新聞事件進行報道寫作;審核完成的稿件;最後發布到用戶端。《今日頭條》Xiaomingbot的工作原理是結合最新的自然語言處理、機器學習和視覺圖像處理的技術之後,通過語法合成與排序學習生成新聞。「DT稿王」則是利用文本解析和信息抽取技術實現信息的自動抽取,再採用機器學習演算法,並融合第一財經編輯記者團隊的經驗、智慧,以模板和規則知識庫的方式,根據實時抽取的信息做出判斷,輸出相應的模板及規則知識庫內容從而產生新聞。

儘管以上4家媒體在自動化新聞的生產流程上略有差別,但在生產流程的關鍵環節還是有相同之處:

第一步,採集撰寫新聞稿件所需要的各種數據。依據關鍵詞、時間或數據指標等,通過應用數據抽取和挖掘技術,採集與報道客體相關的資料以及有關用戶的各類信息。

第二步,對數據進行結構化處理和分析。針對所獲得的數據進行優化分類,通過結構化處理形成高質量的結構化數據,進而對結構化數據進行抽取、計算、統計和分析,發現其中的變化和趨勢,將運算結果與已經設定的新聞標準進行比對,以確定報道選題。

第三步,判定新聞價值,提煉報道選題。通過剖析各種數據的內在關聯性,結合用戶(受眾)數據所呈現的新聞消費模型,人工智慧會提出一些建設性的創作意見,寫作軟體在這些基礎上判定新聞價值和提煉報道選題。在這一過程中,可能需要人工的協助。

第四步,運用演算法,套用已有模板生成規範的新聞稿。美國自動化洞察力公司的Wordsmith平台擁有3億種新聞寫作模板,通過專利語言來建立各種各樣的業務演算法,這些演算法決定每篇新聞報道的選題是什麼、語氣和語調、寫作形式,以及如何 運用辭彙生成最終文章(郭蘇妍,2014)。

第五步,對自動生成的新聞稿進行潤色。自動化新聞在發布前需要潤色、審核,以增強稿件的「溫度」,目的就是讓演算法生成的枯燥文字變得更加可讀。有的演算法會在報道文本的生成過程中加入隨機因素,選擇多種複雜的敘事語氣(如「冷漠的」、「自信的」、「悲觀的」和「充滿激情的」等)以讓文本顯得更多樣。有的演算法能根據主語的單複數而配套使用相應的動詞形式,或者變換使用同義詞,從而使文本讀來不那麼枯燥(鄧建國,2016)。

三、自動化新聞的傳播優勢與局限性分析

新聞生產是一種極富「專業性、創造性」的智力活動,儘管自動化新聞生產有著明顯的快速、準確和針對性等優勢,但其在報道題材、可讀性以及解讀性等方面也存在著一定的局限性。

(一)自動化新聞的傳播優勢分析

技術是推動傳媒業向前發展與革新的動力,技術發展所要解決的主要是實踐應用層面上的效率問題,從媒介技術的角度而言,就是解決如何以最方便、最靈活、最快捷、最經濟、最有效的手段和方法提高信息生產與傳播效率問題,它的內在邏輯是技術理性或工具理性(郭慶光,2011:117-118)。建立在人工智慧和大數據挖掘技術的基礎上的自動化新聞,正是新聞生產與傳播效率提升的體現。

首先,自動化新聞加快了新聞生產的速度和總量。在報道事實性新聞時,媒體最需要的就是速度。特別是在突發性事件報道中,時效性決定了新聞報道的價值和影響力。高速的計算加上預先設置的模板,自動化新聞幾乎可以實現同步播發。2016年裡約奧運會期間,《今日頭條》Xiaomingbot完成一篇稿件的時間約為2秒左右。另外,新聞傳播界普遍認為:自動化新聞在新聞總量中所佔比重將會越來越大。產生這種認識的原因主要有兩點:一是由於撰寫軟體在稿件生產上的高效性,將會大幅度提高新聞報道的總量;二是隨著大數據時代的到來,我們的生活將日益數據化,這就為撰稿軟體的運行提供了豐富的內容資源。

其次,自動化新聞拓寬了新聞報道的範圍。自動化新聞實際上是通過程序軟體的運算來發現新聞的,它能從海量的數據信息中挖掘出具有新聞價值的話題。《洛杉磯時報》的Quakebot可以報道地震探測儀探測到的所有地震,而記者通常只報道超出一定震級或造成重大傷害的地震,自動化新聞生產則突破了人的視野以及時間和精力的限制,大大延伸了報道範圍。儘管受眾可能會對某些報道關注較少,但從總體上還是增加了網路流量。

再次,自動化新聞提高了稿件的質量。只要數據正確,演算法科學且正常運行,自動化新聞的生產就能夠避免出現諸如拼寫錯誤、計算錯誤、事實要素不全等差錯,與記者相比,更能夠保障新聞信息的準確性。眾所周知,現在的自動化新聞主要應用的是數據挖掘和人工智慧技術,囿於目前的技術水平,主要限制在以結構化數據為基礎的新聞稿。隨著技術升級,結構化和非結構化數據信息都可以成為素材,創作出內容更豐富、邏輯更合理,更有人情味的、高質量的新聞報道只是時間問題。

最後,自動化新聞可以有效地生產和推送個性化信息產品。一方面,自動化新聞的應用程序在分析現有媒體報道的基礎上,可以計算出社會普遍關注的話題,並能夠自動將其分門別類,進而有效地提升內容生產的針對性。另一方面,媒體的傳播效果只有在和受眾的互動中才能實現。受眾群的分化意味著相同的信息會被不同的受眾以不同的方式解讀,相同信息的不同解讀方式也可以滿足不同受眾的「口味」。因此,只有加強對受眾的閱讀傾向和興趣點的分析,才能解決「眾口難調」的問題,這個計算量是巨大的,超出了人工能力,而這恰恰是基於大數據技術的運算程序所擅長的。

(二)自動化新聞的局限性

目前,自動化新聞主要集中於財經報道和體育報道,新聞產品也主要是那些標準化程度較高的消息、快訊等新聞體裁。儘管自動化演算法可以提供有關正在發生的事件的信息,但是它們無法解釋該事件為什麼發生(Lazer,2014)。這也就說明,建立在數據分析基礎上的自動化新聞,有時候得出的結論可能是沒有意義的,受眾仍然需要包含邏輯和解釋說明的有效信息(Latar,2015)。即為受眾提供某些事件或現象的深度報道,或幫助受眾提煉出獨到的觀點。

與記者采寫的新聞相比,儘管自動化新聞比記者報道更可靠、更具專業知識,但在可讀性方面,記者報道比自動化新聞更具優勢(Graefe et al,2015)。通過標準化程序生產出來的新聞作品更多的是客觀敘述,很難表達複雜感情,語言也枯燥乏味。新聞報道離不開語境,單純客觀報道新聞而缺乏必要的解釋和背景資料,有時會引發受眾對新聞內容的誤解。

自動化新聞需要龐大資料庫的支持,只有實力雄厚的媒體才能擁有體量巨大、類目齊全的資料庫。此外,自動化新聞生產需要結構化和機器可讀格式的高質量數據,如果缺乏資料庫或者數據質量無法保證,自動化新聞生產也就無從談起了。

像任何其他模型一樣,用於生成自動化新聞的演算法依賴於數據和假設,這兩者都可能帶來偏差和錯誤(Lazer et al,2014)。2015年7月的一篇關於Netflix公司第二季度財報的自動化新聞就出現了錯誤。事實證明,自動化新聞同樣存在報道失誤的風險,而並非萬無一失。

相較於人工的新聞生產方式,自動化生產出來的新聞在報道視角、創造力和思辨性等方面存在短板,但人工智慧處理數據的效率優勢是記者編輯所無法比擬的。物聯網的發展和感測器的應用將會為新聞媒體提供更多的大數據挖掘的時機,或許這將有助於擴大自動化新聞的發展空間;或許在未來的新聞生產流程中,機器幫助我們發現選題,機器幫助我們拓展報道的廣度、深度,機器幫助我們提煉規律,預判內容的傳播效果,反過來指導我們寫作的起點(彭蘭,2016)。

四、自動化新聞對傳媒業的影響

近些年,智能化不僅體現在媒體平台的建設上,而且深入到了新聞生產領域。根據梅賽尼的研究,技術引發社會變革有兩個途徑:創造新機會和產生新問題。前者引發產業結構和社會結構的變化,後者推動新的制度轉型(郭慶光,2011:119)。智能化技術在提升新聞產品質量的同時,也推進了新聞傳播行業的變革。這種變革不僅將對傳統的新聞生產機制、新聞傳播理念產生影響,而且對媒體人的職業發展方向、受眾和社會輿論都將產生深遠影響。

(一)記者的專業技能和職業分工將有改變

就常規性、重複性報道而言,記者難以在速度、準確性上與自動化寫作軟體匹敵。面對自動化新聞,記者們會高度重視分析能力、個性化、創造性以及寫作複雜句子的能力,而不是真實性、客觀性、簡潔化和時效性,當常規的報道可以被自動撰寫,記者們可以在深度報道上花更多時間(Dalen,2012)。因此,從積極的一面看,自動化新聞解放了記者,讓他們去報道不那麼「機械」的新聞;從消極的一面看則可能引發媒體裁員越來越多,以及新聞寫作的商品化(Carlson,2015)。在未來的新聞行業里,記者和人工智慧形成「人機聯姻」的生產模式,演算法用於分析數據、發現有趣的故事並提供初稿。隨後,記者將通過深入分析、採訪重要人物以及幕後故事完善報道。

此外,對於那些僅僅只報道常規性內容的記者,自動化新聞憑藉快速、準確的優點,可能會取代他們的地位,但自動化新聞建立在演算法的基礎上,對於開發新的新聞寫作演算法同樣需要人力資源,從這一方面看,自動化新聞軟體在取代一部分新聞記者的工作的同時,也會產生一些新的職業崗位,記者將在新聞生產過程中扮演新的角色。例如,美聯社聘請了一個自動化新聞編輯,工作內容是確定可以自動化的內部程序。

(二)受眾開始關心內容生產的科學性和透明度

儘管受眾無法辨別人工寫作的內容和軟體寫作的內容,但受眾依然關心撰稿軟體的寫作質量如何,與人工寫作相比會有多大的區別。有研究顯示,儘管撰稿軟體生產的內容是描述性的、乏味的,但同時也被認為是客觀的。人工寫作在內容的清晰易讀上具有優勢,但在可信度、信息量和客觀性方面比不上撰稿軟體(Clerwall,2014)。此外,不管是否被告知稿件是由人工或軟體編寫,受眾對稿件的專業度和信任度的評價並無明顯的差異(Kaa&Krahmer,2014)。機器演算法透明度也是受眾關注的問題,包括自動化新聞演算法的目標和意圖是什麼,誰開發和控制這些演算法,誰對這些內容負責,最終產品在發表前是否有人工編輯審閱等。技術哲學家J·M·斯塔迪梅爾認為,脫離開人類背景,技術就不可能得到完整意義上的理解……設計、接受和維持技術的人的價值與世界觀、傾向與既得利益必然將體現在技術身上(高亮華,1996:14-15)。

儘管數據是客觀的,但在演算法設計的過程中,可能牽涉設計者的傾向與利益取向,這就關係到自動化新聞生產的科學性和透明度問題。因此,媒體首先需要更好地了解受眾對演算法透明性的要求,以及如何將公開的信息用於公眾利益。其次,需要找到披露信息最好的方式,不影響用戶體驗,特別是那些對這些信息不感興趣的人(Diakopoulos,2015)。

(三)新聞媒體將面臨披露源數據的壓力

自動化新聞對新聞媒體來說既是機遇也是挑戰。由於自動化新聞有助於減少生產成本、增加發稿量,就有可能被應用於更具挑戰性的選題。而當自動化新聞涉及批評性報道時,數據的準確性、內容的質量以及程序的透明度將變得更加重要。新聞媒體在自動化內容生產中需要考慮源數據、數據處理和最終輸出有關的問題(Kent,2015)。因此,新聞媒體需要確保有權修改和發布源數據。在數據處理階段,如果基礎數據或處理它們的演算法包含錯誤,撰稿軟體可能會產生大量錯誤的報道。

此外,新聞媒體還必須通過添加有關數據來源的信息、內容的生成方式來證明 該報道是自動生成的,以保證最低級別的透明度。為此,美聯社關於企業財務的自動化新聞在文末都會標註報道的生產者和數據來源。但是,新聞媒體僅僅說明文章是由軟體生產的是不夠的,特別是涉及到批評性或爭議性的話題,受眾對透明度和問責制的要求可能更高。當出現錯誤時,新聞媒體可能會面臨公布源代碼的壓力,他們應該解釋報道是如何產生的,而不僅僅強調內容是由「機器生成的」(Kent, 2015)。

(四)對社會輿論的形成產生負面影響

自動化新聞的一個優勢是生產出個性化內容來滿足個體受眾的信息需求。如前所述,自動化軟體通過抓取、分析受眾在互聯網上的瀏覽痕迹,並建立一種不斷完善的跟蹤、預測機制,就可以有效地推測出受眾的閱讀偏好。據此,媒體可以應用撰稿軟體生產出個性化的內容,並通過智能推薦或智能排序推送至受眾面前。受眾所獲取的信息只是媒體想讓他們獲取的,並且是媒體認為這些信息正是個體受眾所需要的。如此一來,受眾就被人為地與其他信息隔絕開,沉浸在自己偏好的信息世界里,形成「過濾氣泡」(Filter Bubble)。

換句話,「演算法」只提供受眾喜歡閱讀或認同的信息內容,導致個人消費越來越多的同類信息,以至個體受眾不太可能閱讀到與其意見相左的信息或觀點,社會上不同聲音之間的溝通交流日趨減少,社會言論也越來越單一。「演算法」讓「過濾氣泡」現象更加嚴重,給社會輿論的健康形成帶來風險(Pariser,2011)。因此,新聞媒體在憧憬自動化新聞為自身的發展帶來轉機的同時,也要時刻提醒自己,不能置受眾於信息和交流的孤島之中,而要多渠道獲取和發布信息,幫助受眾跳出「過濾氣泡」的禁錮,營造健康、多元的社會輿論環境。

五、結語

內容生產、傳播平台以及受眾行為的智能化等趨勢在不斷推進著傳媒業在智能化發展方面尋求新的競爭優勢。把機器或者程序能做的交給機器和程序,從而把人力解放出來,去從事具有創新要求和需要發揮想象力的工作,這是自工業革命以來自動化革命的基本理念(金兼斌,2014)。印刷術的發明將人類從繁重的抄寫工作中解放出來,讓信息的大量複製與傳播成為可能。智能化開始進入新聞信息的採集、分析、寫作等環節,正逐漸改變現有的生產模式。一旦確定演算法,從收集和分析數據,到撰寫和發布新聞,新聞生產的每個環節都可以自動完成(Graefe et al,2016)。

媒介本身才是真正有意義的訊息。換個容易理解的說法,即人類有了某種媒介才有可能從事與之相適應的傳播和其他社會活動,因此,從漫長的人類社會發展過程來看,真正有意義、有價值的「訊息」不是各個時代的傳播內容,而是這個時代所使用的傳播工具的性質、它所開創的可能性以及帶來的社會變革(郭慶光,2011:120)。自動化新聞不僅將改變新聞的生產方式,還將改變我們的文化生活。

本文系簡寫版,參考文獻從略。原文刊載於《國際新聞界》2017年第5期。

訂閱信息

全國各地郵局均可訂閱《國際新聞界》,國內郵發代號:82-849,歡迎您訂閱!

您也可訪問《國際新聞界》官方網站 http://cjjc.ruc.edu.cn/ ,免費獲取往期pdf版本。

此外,編輯部還存有少量過刊,如需購買可添加【)】諮詢。



熱門推薦

本文由 yidianzixun 提供 原文連結

寵物協尋 相信 終究能找到回家的路
寫了7763篇文章,獲得2次喜歡
留言回覆
回覆
精彩推薦