人機協(xié)同背景下新聞生產(chǎn)流程再造研究_第1頁
人機協(xié)同背景下新聞生產(chǎn)流程再造研究_第2頁
人機協(xié)同背景下新聞生產(chǎn)流程再造研究_第3頁
人機協(xié)同背景下新聞生產(chǎn)流程再造研究_第4頁
人機協(xié)同背景下新聞生產(chǎn)流程再造研究_第5頁
已閱讀5頁,還剩19頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

PAGE1人機協(xié)同背景下新聞生產(chǎn)流程再造研究人機協(xié)同背景下新聞生產(chǎn)流程再造研究Underthebackgroundofhuman-computercollaborationResearchonNewsProductionProcessReengineeringPAGE19摘要5G時代的來臨,人工智能技術的蓬勃發(fā)展,機器新聞寫作伴隨著這股浪潮,也將占據(jù)著越來越重要的作用,它所具備的“數(shù)據(jù)處理“”自主學習“的能力,使得它擁有著巨大的發(fā)展?jié)摿?,它必將會在未來的媒體界占據(jù)的重要地位,得到越來越廣泛的應用。它擁有著很多的優(yōu)點,但是由于目前的技術限制與自身的局限,它也存在著許多的缺點。它的存在不會淘汰掉新聞從業(yè)者,但是也會對新聞工作者提出更高的要求,互相彌補優(yōu)缺點。實現(xiàn)人機協(xié)同,從而提高新聞生產(chǎn)的效率。新聞生產(chǎn)過程的也將逐漸發(fā)生改變,算法生產(chǎn)(AGC)也將與專業(yè)生產(chǎn)(PGC)和用戶生產(chǎn)(UGC)實現(xiàn)三足鼎立。這些改變必將會為媒體界帶來一些極其長遠的影響。本文就人機協(xié)同背景下的新聞生產(chǎn)方式做出探討,對其生產(chǎn)流程進行重構再造,提出優(yōu)化策略。機器新聞寫作作為人工智能技術與新聞界結(jié)合產(chǎn)生的一個典型案例,其具有很大的研究價值與探討的空間。關鍵詞:人機協(xié)同機器新聞寫作新聞生產(chǎn)

AbstractTheadventofthe5Gera,thevigorousdevelopmentofartificialintelligencetechnology,andmachinenewswritingwillalsoplayanincreasinglyimportantrolealongwiththiswave.Itsabilityto"dataprocessing"and"self-learning"makesithaveWithhugedevelopmentpotential,itwillsurelyoccupyanimportantpositioninthefuturemediaindustryandbemoreandmorewidelyused.Ithasmanyadvantages,butduetocurrenttechnicallimitationsanditsownlimitations,italsohasmanydisadvantages.Itsexistencewillnoteliminatenewspractitioners,butitwillalsoputforwardhigherdemandsonjournaliststomakeupforeachother'sadvantagesanddisadvantages.Realizehuman-computercollaboration,therebyimprovingtheefficiencyofnewsproduction.Thenewsproductionprocesswillalsograduallychange,andalgorithmproduction(AGC)willalsoachieveathree-leggedrelationshipwithprofessionalproduction(PGC)anduserproduction(UGC).Thesechangesareboundtobringsomeextremelylong-termeffectstothemediaindustry.Thisarticlediscussesthenewsproductionmethodunderthebackgroundofhuman-computercollaboration,reconstructsitsproductionprocessandproposesoptimizationstrategies.Asatypicalcaseproducedbythecombinationofartificialintelligencetechnologyandthepress,machinenewswritinghasgreatresearchvalueandroomfordiscussion.Keywords:Human-computercollaborationmachinenewswritingnewsproduction

目錄摘要………………………PAGEIIIAbstract…………………PAGEIII緒論………………………11人機協(xié)同的基本概述………………21.1人機協(xié)同的概念……………………21.2新聞生產(chǎn)流程的相關概念…………31.3人機協(xié)同背景下的新聞生產(chǎn)方式…………………42人機協(xié)同背景下新聞生產(chǎn)模式分析………………62.1抓取數(shù)據(jù):資源庫整合……………62.2數(shù)據(jù)分析:智能化分析……………82.3導入模板:格式化嵌套……………102.4輸出內(nèi)容:全平臺分發(fā)……………123人機協(xié)同背景下新聞生產(chǎn)流程的優(yōu)化策略………133.1平臺整合:資源庫整合做到內(nèi)容深耕……………133.2新聞分工:優(yōu)勢互補實現(xiàn)人機協(xié)同………………143.3產(chǎn)量提升:領域覆蓋凸顯長尾效應………………15結(jié)論………………………17致謝………………………18參考文獻…………………19緒論2016年,谷歌公司研發(fā)的人工智能程序阿爾法狗擊敗了韓國的圍棋名將李世石,人們意識到人工智能技術已經(jīng)是一個不容小覷的力量了。人工智能技術發(fā)展到今天,已經(jīng)滲透到各個領域之中了。人工智能技術一直是學術界探討的熱點,隨著5G時代的來臨,人工智能技術更是迎來了一次新的發(fā)展高潮,隨著傳輸速度的增加。作為人工智能技術在媒體界的應用之一——機器人新聞,更是得到了蓬勃發(fā)展的土壤。這幾年來也一直是研究的熱點。人與機的關系也在慢慢發(fā)生改變。基于人機協(xié)同下背景下的新聞生產(chǎn)流程的再造研究,是很有必要的,隨著人工智能技術的不斷發(fā)展,機器新聞寫作必將會有新的變化,其現(xiàn)有的新聞生產(chǎn)流程需要去適應新的變化,理論方面的研究需要走在前頭。無論科技如何發(fā)展,新聞報道始終堅持內(nèi)容為王,沒有內(nèi)容價值的新聞報道價值將大打折扣。機器新聞這一事物的出現(xiàn)必將帶來新聞生產(chǎn)和傳播過程的新現(xiàn)象。因此研究分析這種新型的新聞生產(chǎn)方式就非常重要。本研究擬就新背景下的新聞生產(chǎn)流程進行探討,為新聞生產(chǎn)研究注入新的方向。關于機器新聞寫作于人機協(xié)同的發(fā)展方向,國內(nèi)外都很早開始研究了,時至今日,機器新聞寫作與人機協(xié)同的相關性研究也還在不斷探討中,在探討中完善。但人機協(xié)同的發(fā)展方向,是目前最有依據(jù)的方向?,F(xiàn)有的研究對未來人機協(xié)同的新聞生產(chǎn)模式都作出了一番探討,未來更加需要復合型的媒體人才,對于深度挖掘、專業(yè)性等提出了更高的要求。且了解算法也會是一個人才要求。但是對于人機協(xié)同背景下的新聞生產(chǎn)流程的研究還不夠完善。

人機協(xié)同的基本概述1.1人機協(xié)同的概念隨著5G時代的來臨,人工智能技術的持續(xù)發(fā)展,人機之間的關系也在慢慢的發(fā)生改變,從單純的人使用機器,把機器作為工具使用。到現(xiàn)在機器可以全自動生產(chǎn)一篇合格的新聞,機器的地位變得越來越重要。機器新聞寫作對比人類而言的進步將更快,它所具備的高效、低成本、極強的數(shù)據(jù)處理能力,是人腦所不能及的。但是它也無法擺脫算法的限制。未來的新聞生產(chǎn)發(fā)展方向是會走向人機協(xié)同的方向?!半S著機器的不斷學習,機器的自主意識不斷增強,可以獨立完成更為豐富的內(nèi)容創(chuàng)造,機器和媒體人共同完成內(nèi)容的發(fā)現(xiàn)、寫作、傳播以及預測?!盵1]未來,人機協(xié)同將是傳媒業(yè)的常態(tài)。二者如何協(xié)同合作,生產(chǎn)出更多元、更高品質(zhì)的作品,是機器新聞寫作下一步努力的方向。人工智能與新聞業(yè)相結(jié)合產(chǎn)生了一個新奇的事物,那就是機器新聞寫作,是新聞業(yè)基于人工智能技術創(chuàng)新出的內(nèi)容生產(chǎn)程序。它是利用人工智能技術在新聞界實現(xiàn)的一種內(nèi)容生產(chǎn)程序。將人工智能技術的各種優(yōu)點,完美的運用到對新聞內(nèi)容的生產(chǎn)當中去,以此來實現(xiàn)新聞內(nèi)容的自動化生產(chǎn)。在人工智能時代還未來臨之前,計算機技術就已經(jīng)對新聞產(chǎn)業(yè)帶來了非常深刻的影響,利用計算機技術已經(jīng)對新聞行業(yè)產(chǎn)生了巨大的變革。但是人工智能時代為傳媒界帶來的機器新聞寫作的概念與計算機技術對傳媒界的影響又有著很大的區(qū)別。數(shù)據(jù)新聞就是一種計算機技術在新媒體時代對傳媒界的一種影響的存在,在數(shù)據(jù)新聞的生產(chǎn)過程中,計算機技術輔助記者完成新聞報道,利用計算機的強大運算功能幫助記者搜集新聞的數(shù)據(jù)與相關音視頻素材。但是其中的選題、具體的文字撰寫、新聞的表現(xiàn)形式都是記者來實現(xiàn)的。計算機僅僅是作為一種工具而已。但是機器新聞寫作則不同,它的生產(chǎn)過程是完全的自動化,不需要人的參與,從新聞素材、選題、撰文、發(fā)表等全部的過程全部都由智能算法來解決。人工的參與并不會對其產(chǎn)生本質(zhì)性的影響。機器新聞這一新鮮產(chǎn)物擁有許多人類沒有的優(yōu)點,但是也擁有著一些難以彌補的缺點。它的存在可以極大的解放新聞記者和編輯的工作壓力,讓他們從重復、低端的工作內(nèi)容中解放出來,轉(zhuǎn)向更加富有創(chuàng)造力的深度新聞的生產(chǎn)中去。但是機器新聞寫作也面臨著模板化、單一化、情感內(nèi)容的缺失、詞義邏輯等問題?!皺C器新聞寫作受限于技術規(guī)則的影響,存有自身的局限性。與人類相比,機器最大的軟肋在于缺乏人的思辨能力、情感表達能力和創(chuàng)造能力?!盵2]這些問題受制于現(xiàn)有的技術等方面。但是毫無疑問的是“人機協(xié)同”會成為未來新聞生產(chǎn)的一個極其重要的模式。新聞記者與算法互相彌補。各自發(fā)揮自己的長處,從而使新聞生產(chǎn)具備更多的可能性。由于算法的學習的特性,在短時間里,它將比人類具備更大的發(fā)展?jié)摿Γ梢韵胂?,一個機器新聞寫作程序,一秒鐘可以生成成千上萬條新聞,并且可以根據(jù)不同讀者的興趣為他們提供不同的內(nèi)容,個性化的匹配新聞內(nèi)容。可以節(jié)省極大的人力物力。1.2新聞生產(chǎn)流程的相關概念傳統(tǒng)的新聞生產(chǎn)方式主要由記者獨立采訪、編輯協(xié)作統(tǒng)籌、組織控制把關,是組織化的產(chǎn)物,也是相對封閉的活動。到了網(wǎng)絡時代,隨著信息的透明化,傳播的簡單快速化,由專業(yè)記者生產(chǎn)(PGC)逐漸變成了專業(yè)記者生產(chǎn)(PGC)+用戶生產(chǎn)(UGC)。新聞生產(chǎn)即新聞制造,新聞生產(chǎn)是指在不損害公眾利益的前提下,有計劃有組織地策劃具有新聞價值的事件,舉辦具有新聞價值的活動。從廣義上講,新聞生產(chǎn)是指新聞機構及從業(yè)的選擇,加工與傳播,它是一條單向的鏈條,由生產(chǎn)主體、生產(chǎn)客體以及所形成的生產(chǎn)關系構成。一個新聞的生產(chǎn)過程大致是記者發(fā)現(xiàn)新聞線索,前往現(xiàn)場采訪或者遠程聯(lián)系當事人,然后撰稿成文或編輯播出。傳統(tǒng)的新聞生產(chǎn)模式是一個鏈態(tài)的線性模式,并且這個模式是封閉的。在整個新聞生產(chǎn)過程中,新聞從業(yè)者的采集、寫作、編排都是在新聞機構內(nèi)部運作的。受眾無法看到新聞是如何生的,更無法參與到新聞的生產(chǎn)過程中。新聞生產(chǎn)作為社會傳播活動的重要環(huán)節(jié)與實踐方式,成為展現(xiàn)各種社會關系的一種新型空間形態(tài)。新聞生產(chǎn)的空間形態(tài)是生產(chǎn)者以社會現(xiàn)象為關注點,借助一系列技術手段完成的物質(zhì)性和符號性合力架構并呈現(xiàn)的樣式與類型。隨著人工智能時代的來臨,社會的各行各業(yè)都逐漸發(fā)生了改變,其中信息傳播與分享的方式更是改變很多,電視、報紙和廣播的話語權已經(jīng)發(fā)生偏移,由于網(wǎng)絡技術的發(fā)展,人們隨時隨地都可以在一起討論新聞事件。人們在各大客戶端、微博、微信中討論近期發(fā)生的各種大事。新聞生產(chǎn)的主客體的界限也變得模糊,新聞生產(chǎn)從單一的新聞記者的專業(yè)化生產(chǎn),變?yōu)榱藢I(yè)化生產(chǎn)+用戶生產(chǎn)。新聞內(nèi)容展現(xiàn)的主要陣地發(fā)生了轉(zhuǎn)移,近年來,微博、抖音、微信公眾號催生了一大批的自媒體從業(yè)者,他們發(fā)布的內(nèi)容,在短時間內(nèi)就能夠引起巨大的關注,還有眾多的草根用戶,也會在其中分享自己的身邊事等等。各大官媒也紛紛開通微博、抖音、微信公眾號等渠道,搶占陣地。信息來源的去中心化和泛化帶來了傳播內(nèi)容的碎片化、文本來源的多元化。1.2人機協(xié)同背景下的新聞生產(chǎn)方式人工智能時代的來臨,機器新聞寫作的誕生。預示著新聞生產(chǎn)逐漸將走向?qū)I(yè)記者生產(chǎn)(PGC)+用戶生產(chǎn)(UGC)+算法生產(chǎn)(AGC)三者鼎立的狀態(tài)。記者采訪撰寫稿件。用戶依靠微博等社交軟件分享,新聞事件。機器新聞寫作依靠數(shù)據(jù)庫抓取數(shù)據(jù),然后通過算法分析數(shù)據(jù),選出帶有新聞性的內(nèi)容,然后嵌入模板,生成新聞內(nèi)容。它的高效、個性化、極強的數(shù)據(jù)處理能力都讓它成為了,不可小覷的力量?!皺C器新聞寫作,是自動搜集與處理數(shù)據(jù)、并生成完整的新聞報道的計算機程序的統(tǒng)稱?!盵3]“機器新聞寫作”最早來自美國,是指利用算法對數(shù)據(jù)經(jīng)行收集、加工、生成的一種新聞報道程序,使新聞生產(chǎn)主體實現(xiàn)機器化、自動化和智能化。近年來,我國也在這方面做出了較多的有益探索與嘗試,2015年騰訊推出“DreamWriter”的自動化新聞寫作機器人,完成一條關于我國2015年8月CPI的稿件,這是我國媒體第一次使用機器新聞寫作的嘗試。到2016年第三季度,騰訊的人工智能寫作系統(tǒng)“Dreamwriter“所撰寫的體育賽事新聞報道的稿件數(shù)量已超過三千多篇;新華社在2015年11月17日也正式啟用了寫稿機器人——“快筆小新”。在2016年的里約奧運會上,《華盛頓郵報》大膽創(chuàng)新,采用“機器人記者”與傳統(tǒng)記者聯(lián)手展開新聞報道。而由北京大學和今日頭條合作研發(fā)的“機器人記者”小明(Xiaomingbot)也在里約奧運會上大顯身手,新聞生產(chǎn)效率高,成功發(fā)稿450多篇,單篇瀏覽閱讀量突破10萬,贏得廣泛反響與好評。全媒體時代,這無疑為新聞傳播改革提供了全新方向與思路,不僅為傳統(tǒng)媒體轉(zhuǎn)型創(chuàng)造了巨大機遇,而且為網(wǎng)絡媒體發(fā)展拓展了生存空間。但客觀來講,“機器人記者”本身也存在著一定局限,并帶來了許多現(xiàn)實問題,不僅對傳統(tǒng)新聞生產(chǎn)機制產(chǎn)生了影響,而且對傳統(tǒng)新聞傳播理念和媒體人的職業(yè)方向產(chǎn)生了影響。2人機協(xié)同背景下新聞生產(chǎn)模式分析2.1抓取數(shù)據(jù):資源庫合作人機協(xié)同背景下,人與機器的關系不是誰大于誰,而是互相協(xié)作的關系,人通過自己的創(chuàng)作產(chǎn)生出新聞內(nèi)容,而“機”需要數(shù)據(jù)輸入。機器新聞寫作就是其中的一個典型。機器新聞寫作的數(shù)據(jù)抓取相當于記者的前期采訪與資料搜索,通過大數(shù)據(jù)技術從與媒體機構合作的數(shù)據(jù)庫中抓取與報道主題相關的、有效的海量數(shù)據(jù)。目前主要的應用方面是氣象、災害、財經(jīng)、體育等領域。其都以數(shù)據(jù)作為支撐且對時效性的要求較高??焖?、精準的抓取正是機器新聞寫作在這些領域的優(yōu)勢所在。機器新聞寫作的數(shù)據(jù)抓取過程相當于新聞記者的前期采訪工作,運用大數(shù)據(jù)技術在數(shù)據(jù)庫中抓取與報道主題相關的、有效的海量數(shù)據(jù)。這一數(shù)據(jù)庫通常是與媒體機構合作的數(shù)據(jù)庫,最終的新聞成稿質(zhì)量也很大程度取決于數(shù)據(jù)庫素材的質(zhì)量。目前,財經(jīng)新聞、體育新聞、氣象新聞與地震報道相關領域是機器新聞寫作主要應用的地方,這一類的新聞內(nèi)容報道的明顯特征就是它們主要以數(shù)據(jù)為基石,且對于語言邏輯的要求沒有社會性新聞那么高。機器新聞寫作的數(shù)據(jù)處理優(yōu)勢讓它們能夠勝任這一領域。其就是依托對目標數(shù)據(jù)的處理才能生產(chǎn)出完整的新聞報道。大數(shù)據(jù)技術使得機器新聞寫作在對數(shù)據(jù)的抓取階段體現(xiàn)出了信息來源廣和能夠精準抓取的優(yōu)勢。數(shù)據(jù)來源途徑1.自身的數(shù)據(jù)庫2.合作機構組織的數(shù)據(jù)庫3.政府網(wǎng)站、公開網(wǎng)站發(fā)布的數(shù)據(jù)4.網(wǎng)絡上用戶創(chuàng)作的內(nèi)容機器新聞的素材來源非常多,既可以從合作的機構與公司的數(shù)據(jù)庫中進行抓取,而且還可以搜集在各大網(wǎng)絡平臺中公共、公開的信息。目前,機器新聞寫作的主要應用領域是財經(jīng)與體育。所以它的數(shù)據(jù)來自于與媒體合作的數(shù)據(jù)庫,這些數(shù)據(jù)通常是各大體育賽事的實施比分、股市的漲跌信息、天氣預報信息、地震的預報、各大數(shù)據(jù)報表,這些就是機器新聞寫作數(shù)據(jù)抓取的重要來源。除了對這些專業(yè)的數(shù)據(jù)庫的信息進行抓取之外,它還可以針對網(wǎng)絡上用戶創(chuàng)造出來的內(nèi)容進行抓取,搜集各種社交平臺中的熱點話題,目前已從僅可獲取固定官方機構發(fā)布的信息外,還可搜集各種社交平臺中的熱點話題,這樣就極大的豐富了新聞來源,使新聞內(nèi)容得到更多的數(shù)據(jù)支撐。在現(xiàn)在這個新媒體的時代,用戶兼具著信息的傳播者于接收者的兩重身份,他們在獲取網(wǎng)絡中各種信息的同時,也是海量繁雜的信息的生產(chǎn)者,他們所生產(chǎn)出來的各種信息是用戶生產(chǎn)內(nèi)容(UGC),主要是指原創(chuàng)內(nèi)容。UGC內(nèi)容由于用戶基數(shù)大的原因,其生產(chǎn)出來的信息遠遠超過專業(yè)內(nèi)容的生產(chǎn)量。但是也由于用戶質(zhì)量的參差不齊,信息中也由著許多劣質(zhì)、無用甚至有害的信息。要想利用好這些信息,也需要更加完備的機制與技術。據(jù)新華社工作人員介紹,新華社開發(fā)的機器新聞寫作程序“快筆小新”已經(jīng)可以自動采集多位有權威的金融領域?qū)<业奈⒉瑢崟r關注并采集其發(fā)布在微博中的相關言論,并能夠?qū)λ麄兊奈⒉﹥?nèi)容進行關聯(lián)分析,分析結(jié)果作為素材供編輯記者采寫深度稿件使用。2016年的里約熱內(nèi)盧夏季奧林匹克奧運會中,今日頭條旗下的機器人記者Xiaomingbot在整個奧運會期間自動生成大約500篇的資訊和簡訊。贏得了一百多萬的閱讀量,可謂賺足了眼球。寫作機器人Xiaomingbot是今日頭條實驗室研發(fā)的自動化寫作程序,在2016年里約熱內(nèi)盧奧運會正式投入使用,后續(xù)相繼在歐洲冠軍聯(lián)賽、意大利足球甲級聯(lián)賽和美國職業(yè)籃球聯(lián)賽等各種體育賽事中得以應用。是國內(nèi)第一個可以采寫奧運賽事的機器新聞寫作程序。在2016年的里約熱內(nèi)盧奧運會期間,它通過和奧組委合作,在奧組委的比賽數(shù)據(jù)庫中抓取賽事數(shù)據(jù)來實時協(xié)作體育賽事新聞報道,,平均每天生成30——40篇稿件,最短兩秒可以完成一篇報道。“未來的發(fā)展瓶頸并不在生成的環(huán)節(jié),而是在數(shù)據(jù)采集環(huán)節(jié)。數(shù)據(jù)采集有多快,新聞生成就有多快?!盵5]人工智能的基礎是數(shù)據(jù),數(shù)據(jù)數(shù)量是否足夠、數(shù)據(jù)質(zhì)量是否準確決定著機器新聞寫作最終呈現(xiàn)出的新聞內(nèi)容是否真實、是否具有新聞價值。機器新聞寫作的過程需要建設龐大的特定領域的數(shù)據(jù)庫,從數(shù)據(jù)庫中抓取對應新聞主題的精準、高質(zhì)量的數(shù)據(jù)為機器新聞寫作提供素材。只有在這個階段抓取到高質(zhì)量的數(shù)據(jù)內(nèi)容,才能在后續(xù)的內(nèi)容編寫階段中創(chuàng)作出較高新聞價值的稿件。機器新聞寫作能夠在復雜、龐大、無序的個體數(shù)據(jù)中分析整理出具有邏輯性、更為本質(zhì)的規(guī)律,進而整合多個規(guī)律共同作用,提供解決問題的對策。通過優(yōu)質(zhì)信息來學習,從而完善其整個創(chuàng)作過程。目前,機器新聞寫作在財經(jīng)領域與體育領域的發(fā)展較為迅速,很大一部分原因就是這些領域的數(shù)據(jù)更為的“干凈”,比較單一且準確性高。但是不足的一點也是,參考、引用數(shù)據(jù)庫和各種網(wǎng)絡數(shù)據(jù)目前是機器新聞寫作發(fā)現(xiàn)新聞的唯一方式,這些數(shù)據(jù)是機器新聞寫作發(fā)現(xiàn)新聞線索的“土壤”。也就是說,機器新聞寫作只能從海量“碎片化”信息中抓取相關數(shù)據(jù),如果沒有這些規(guī)??捎^的、既有的數(shù)據(jù),機器新聞寫作就無法發(fā)現(xiàn)新聞線索。2.2數(shù)據(jù)分析:智能化分析人機協(xié)同背景下,機器新聞寫作程序搜集到的海量的數(shù)據(jù)導入新聞寫作程序之后,就開始分析數(shù)據(jù),從中篩選出具有的新聞性的數(shù)據(jù)。人工智能的優(yōu)勢就是可以“自主學習”和“快速的數(shù)據(jù)處理能力”。通過對算法的訓練,其可以以極快的速度,且無遺漏的選出具有新聞性的數(shù)據(jù)。人腦在海量的數(shù)據(jù)分析面前,難免會出錯且耗時耗力。這里也是機器新聞寫作的核心競爭力所在。通過數(shù)據(jù)的抓取將數(shù)據(jù)導入機器新聞寫作程序后,接下來的步驟就需要對其進行篩選、整理和分析。人工智能特有的兩種最重要的能力就是“快速處理”和“自主學習”,利用大數(shù)據(jù)和云計算技術對數(shù)據(jù)進行高效的處理,這兩項技術也正是機器新聞寫作的核心所在,在這個過程中計算機基于算法進行數(shù)據(jù)分析和自我學習。機器新聞寫作能夠自我深度學習的功能,就是模仿人腦的工作機理來對數(shù)據(jù)進行處理,并生成可以給人類參考的信息。這個過程就是對數(shù)據(jù)新聞價值的判斷考量,將數(shù)據(jù)統(tǒng)計結(jié)果與預設好的新聞主題進行對比,將符合新聞主題要求的數(shù)據(jù)予以保留,將無用的信息加以剔除。保留下來的數(shù)據(jù),機器新聞寫作會對其進行結(jié)構化歸類和統(tǒng)計分析,呈現(xiàn)出數(shù)據(jù)的趨勢與規(guī)律,從而發(fā)現(xiàn)數(shù)據(jù)中的新聞點。一般而言算法會挑選數(shù)據(jù)中比較“沖突”“反常”的新聞點,比如體育比賽中的“最高記錄”“最低記錄”“比分差距”,還有“場均得分“”歷史記錄“等更加細微的點,無論這些數(shù)據(jù)是程序自身計算得出還是人工提供,都會被算法歸為具有新聞價值屬性的數(shù)據(jù),根據(jù)對數(shù)據(jù)新聞點的考量進而確定報道的主要內(nèi)容。標題項目隊名比分時間陣容馬賽主場1-0險勝蒙彼利埃法甲第38輪馬賽;蒙彼利埃馬賽1:0蒙彼利埃2019年5月25日3時5分馬賽(4-2-3-1)蒙彼利埃(3-4-3)中超第11輪北京人和驚險取勝天津泰達中超第11輪北京人和;天津泰達北京人和2-1天津泰達北京時間2019年5月25日15時30分北京人和(4-4-2)天津泰達(4-3-3)桑坦德梅開二度,博洛尼亞主場3-2戰(zhàn)勝那不勒斯意甲第38輪博洛尼亞;那不勒斯博洛尼亞3-2那不勒斯北京時間2019年5月26日2時30分博洛尼亞(4-2-3-1)那不勒斯(4-2-3-1)薩索洛全場僅有3腳射正!亞特蘭大主場3-1戰(zhàn)勝薩索洛意甲第38輪亞特蘭大;薩索洛亞特蘭大3-1薩索洛北京時間2019年5月27日2時30分亞特蘭大(3-4-1-2)薩索洛(4-3-3)歐冠決賽熱刺0:2不敵利物浦送給對手一場勝利歐冠決賽利物浦;熱刺利物浦2:0熱刺北京時間2019年6月2日3時0分熱刺(4-2-3-1)利物浦(4-3-3)抓取的部分維度數(shù)據(jù)拿機器人寫作程序Xiaomingbot在意大利足球甲級聯(lián)賽的案例《薩索洛全場僅有3腳射正!亞特蘭大主場3-1戰(zhàn)勝薩索洛》來說,經(jīng)過數(shù)據(jù)分析,新聞的時間、地點、人物、事件等相關信息,“僅有三腳射正”、“薩索羅本賽季進球數(shù)一度排名聯(lián)賽第一”等,具有新聞點的信息在數(shù)據(jù)分析之后被保留的下來。記者們每天會面臨海量的碎片化信息,如何從眾多信息中找到足夠多的新聞點,這成為人工難以解決的難題。而人工智能在數(shù)據(jù)處理能力和處理速度上的優(yōu)勢是人類無法比擬的。于是機器新聞寫作可以將記者從這些繁雜、低端的工作中給解放出來。2.3導入模板:格式化嵌套經(jīng)過前兩個階段留下來的具有新聞性的數(shù)據(jù),到這一步會嵌入模板里,生成具有邏輯性的符合人類閱讀習慣的文章。其文章版式與語句格式都是模板。但由于技術的限制,目前還存在許多的不足之處,例如模板的單一與對人類語言內(nèi)涵的理解不足。這一點機器新聞寫作程序Xiaomingbot也比較明顯,其在意大利足球甲級聯(lián)賽的《意甲第13輪恩波利0:4佛羅倫薩遺憾失利》中,除在末尾兩段對雙方陣容的介紹中沒有配圖之外,其它段落基本上都是一個段落加一張圖片的形式,在大部分其它賽事的報道中也是如此,少有變化。且其在2019年法甲期間的賽事標題也可以看出明顯的規(guī)律,其中一段時間,就采用“某隊主場+比分+結(jié)局+隊名”的結(jié)構。其對符號的意義理解也存在不足,最典型的一次就是在里約奧運會期間曾在報道中寫道“絕望之際,失敗女神朝其拋出了橄欖枝?!憋@然機器人沒能領會“橄欖枝”在人類語言中蘊含的內(nèi)涵?!伴蠙熘Α笔且粋€褒義的詞語,我們一般會寫“勝利女神的橄欖枝”,不會將“橄欖枝”與“失敗女神聯(lián)系在一起”。人工智能技術的進步,使得它可以模仿人的能力,幫助人類做一些事情,從而實現(xiàn)對人類勞動力的解放,機器新聞寫作的這種運用算法生成內(nèi)容的技術也是模仿記者撰寫、創(chuàng)作文字稿件的過程。機器新聞寫作的語義邏輯算法功能為了使其所生成的文字與人工所寫新聞一樣的具有可讀性與邏輯性,會不斷的審視在算法過程中所使用的模板框架和新聞素材的新聞點,并將生成的語句與人類語言進行對比與替換。經(jīng)過復雜的算法程序處理后所生產(chǎn)出的新聞內(nèi)容能夠?qū)崿F(xiàn)與記者的文字內(nèi)容差距不大,特別是體現(xiàn)在機器新聞寫作所擅長的財經(jīng)報道、體育報道中,其對數(shù)據(jù)的精準處理能力能夠讓它在某些程度上甚至做的比人類更好。機器新聞寫作在這一過程中是基于系統(tǒng)內(nèi)存在的眾多寫作模板的存在,根據(jù)新聞主題將處理好的新聞素材嵌入模板,進而生成連貫有邏輯的文字內(nèi)容。但是由于目前技術方面的不足,現(xiàn)在機器新聞寫作的新聞內(nèi)容生產(chǎn)水平仍然處于初級階段,主要集中于運用在數(shù)據(jù)信息豐富、邏輯結(jié)構簡單的財經(jīng)領域與體育領域。因為是模板化的嵌套,所以機器新聞寫作程序不能像人腦那樣具備豐富的邏輯性與靈活性。其生產(chǎn)出來的文字稿件,也會顯得單一化、枯燥化和對某些詞語含義的理解不夠,出現(xiàn)錯用的情況。2.4輸出內(nèi)容:全平臺分發(fā)人機協(xié)同背景下機器新聞寫作程序的所創(chuàng)作的內(nèi)容在這一步會經(jīng)由人工審核后發(fā)出,特別是涉及到重大敏感的某些議題、令人不適的圖片內(nèi)容等方面。審核完成后會直接向各大平臺終端及目標人群,機器新聞寫作全自動化的特點體現(xiàn)在內(nèi)容創(chuàng)作過程中,即在而分發(fā)之前的三個階段都是機器新聞寫作程序的自動化運作的過程。機器新聞寫作生產(chǎn)的新聞稿件在推送前需要編輯來審核,通過之后發(fā)布到各平臺或者推送至用戶。由此也可得知,“把關人”環(huán)節(jié)在機器新聞寫作中依舊不可缺失,而且這一“把關人”角色通常是有記者和編輯來擔任。不過,隨著機器新聞寫作技術的不斷完善,機器新聞寫作相較于人類記者而言它的誤差和錯誤率更低,有些媒體機構便舍棄了對機器新聞寫作所生成內(nèi)容在這一階段的審核。此外,在對新聞稿件的推送階段,機器新聞寫作還能夠精準的把個性化內(nèi)容推送到各個端口渠道和各類目標人群,從而提高傳播速度和提升傳播效果。Xiaomingbot所撰寫的體育新聞報道生成之后就會發(fā)自動上傳到今日頭條平臺,并在微博等平臺進行轉(zhuǎn)載。其內(nèi)容會同其它創(chuàng)作者上傳的內(nèi)容一樣,個性化的匹配讀者。3人機協(xié)同背景下新聞生產(chǎn)流程的優(yōu)化策略3.1平臺整合:資源整合做到內(nèi)容深耕機器新聞寫作從根本上講是利用大數(shù)據(jù)技術抓取數(shù)據(jù)按照一定的模式自動生成的新聞,其是人工智能技術的一種應用,擁有自主學習的能力。通過優(yōu)勢數(shù)據(jù)來訓練算法,其也能得到更好的成長。但是目前新聞寫作機器人基本上都是通過合作的媒體平臺的數(shù)據(jù)庫,來抓取數(shù)據(jù)。網(wǎng)絡上的公用信息雖然海量,但是也不免有許多劣質(zhì)信息摻雜其中。在網(wǎng)絡時代,信息其實就是一種資本,對于信息,都是抱著敝帚自珍的心態(tài)在其中,但是對于受眾來說,面對海量的信息,高質(zhì)量的信息才是關鍵。整合媒體信息資源,既有利于機器新聞的發(fā)展,也有利用媒體人的轉(zhuǎn)型升級,復合型人才更加重要,深耕于內(nèi)容。對于受眾來說也加健康。如果把機器新聞寫作程序比作一個人,那么其運用的數(shù)據(jù)就相當于“他“所吃的”食糧“,這將直接影響到”他“是否成長的壯實健康。食材的多樣性也影響到營養(yǎng)的均衡。機器新聞寫作程序的本質(zhì)是人工智能技術的應用,人工智能擁有著”自主學習“的能力,可以讓它不斷進步,擁有無限的潛力。如果信息的質(zhì)量不好的話,無論再優(yōu)秀的人工智能,最終也得到不了好的成果,數(shù)據(jù)是人工智能的基礎。機器新聞寫作的數(shù)據(jù)來源多是一些與媒體合作的機構與公司或者公開的網(wǎng)絡信息。這些信息都是有主的,想要獲取必須通過資源置換或者利益交換得來。機器新聞寫作的發(fā)展?jié)摿κ艿搅讼拗?,若擁有足夠多的?yōu)質(zhì)信息來供養(yǎng)人工智能,那么其技術的進步也將得到極其快速的發(fā)展,其將成為一個極其重要的新聞稿件的來源,且其應用領域也將不僅僅是財經(jīng)、體育、氣象災害這些方面。在機器新聞寫作高速發(fā)展的同時,新聞記者的作用其實不是被弱化了,而是顯得更加重要了,人工智能的發(fā)展速度再快,在短時間內(nèi)也絕不可能替代人工的作用。而是解放了新聞記者的生產(chǎn)力,使得他們能夠發(fā)揮出在情感與講故事方面的能力,感性才是人的優(yōu)勢,這也是許多文學著作的魅力所在。人工智能技術可以全自動的完成全部的工作,但是它也離不開人的存在,除非它真的有一天能夠擁有自主的思維,否則它還是需要人類來幫助它實現(xiàn)進步,需要人來后臺操作、遙控監(jiān)督、檢查巡視,從而能夠使它能夠在預設的程序軌道中正常的運作。這是一個人機協(xié)同的過程,這種人機協(xié)同的工作模式可以很大限度的減少人類的勞動強度,提高生產(chǎn)的效率,人在其中可以將更多的精力投入到更高級的腦力勞動中去。3.2新聞分工:優(yōu)勢互補實現(xiàn)人機協(xié)同機器新聞寫作的優(yōu)勢之處主要在于其前兩步,抓取數(shù)據(jù)與分析數(shù)據(jù)。而這也是人腦對比機器的劣勢所在,媒體人可以充分利用它的優(yōu)勢所在,優(yōu)化新聞生產(chǎn)流程,更好的人機協(xié)同。機器新聞的優(yōu)勢將注定它要淘汰掉部分只會剪切,復制的“消息型”記者。減少平均人工成本,就像工廠自動化淘汰掉一部分工人一樣,復合型人才將會被保留。對于只需要簡單邏輯與數(shù)據(jù)的短消息報導來說,目前的機器新聞寫作能力完全可以勝任。這類新聞完全可以交予機器新聞寫作程序來完成,隨著技術的發(fā)展,雖然展示無法擺脫模板、算法的鉗制,但跨領域的消息報導完全可以勝任,而不僅僅局限于目前的氣象、災害、財經(jīng)、體育方面。而更深層次的高要求文章,它的數(shù)據(jù)抓取與數(shù)據(jù)分析能力也能幫助實現(xiàn)。對于深度報道方面,機器新聞還難以達到專業(yè)記者的水準,但是它對海量數(shù)據(jù)的抓取于精準高效的數(shù)據(jù)分析能力卻可以彌補人腦在這方面的不足之處。以往都會有“線人”的說法,記者的人脈也代表著其消息的靈通和更多的新聞。但是新媒體環(huán)境下,社交軟件的風靡。人們有話就會在網(wǎng)絡上面表達,很多大新聞事件都在網(wǎng)絡上面發(fā)酵,記者們也會在網(wǎng)絡上面查找新聞線索。這個工作完全可以交予算法來做,抓取網(wǎng)絡上的海量公共信息,通過算法來發(fā)現(xiàn)其新聞性,給記者提供線索。在撰寫深度報道與評論時,往往需要搜集大量的資料,這一過程也可以充分利用人工智能來收集信息。算法可以在前期收集海量的相關信息,形成某一新聞事件的整體分析,讓有效信息浮出水面,節(jié)省大量的時間成本。機器新聞寫作的優(yōu)勢在于對海量數(shù)據(jù)素材的抓取和處理,它能夠在預設的模式化框架中進行快速和精準的內(nèi)容撰寫。所以機器新聞寫作的出現(xiàn)讓新聞生產(chǎn)速度得到了提升,精簡了新聞生產(chǎn)流程,也改變了新聞內(nèi)容的傳播方式。機器新聞寫作和新聞工作者之間優(yōu)勢互補,機器新聞寫作由于它的特性必將得到越來越大的應用,這一發(fā)展趨勢對媒體工作者的媒介素養(yǎng)和專業(yè)技能都提出了新的要求。目前機器新聞寫作已經(jīng)能夠采寫財經(jīng)、體育、氣象災害方面的新聞報道,隨著技術的進步也將逐漸應用到越來越多的領域,在一定程度上面將記者從繁瑣的信息搜集工作中解放出來了。人工智能技術對數(shù)據(jù)的強大分析處理能力已經(jīng)使記者的功能角色由信息的“提供者”轉(zhuǎn)變?yōu)樾畔⒌摹敖忉屨摺?,動態(tài)的新聞報道已經(jīng)不再是記者的工作重點,他們將會有跟多的精力將集中在完成那些機器新聞寫作所不能夠完成的深度解釋性報道和調(diào)查性報道,充分發(fā)揮自身的優(yōu)勢。同時,機器新聞寫作也能夠替代記者完成部分的新聞采編工作,并且能夠通過大數(shù)據(jù)技術對用戶瀏覽數(shù)據(jù)的分析,推斷出用戶的喜好,對受眾進行精準化的內(nèi)容推送,提供更加個性化的內(nèi)容服務。在這種場景下,對新聞工作者提供了更高的要求,他們需要適應好這一角色,處理好與機器的關系。工具使用能力、數(shù)據(jù)分析處理能力、編碼能力等都將成為新聞工作者的必備技能。3.3產(chǎn)量提升:領域覆蓋凸顯長尾效應新聞記者的精力是有限的,其產(chǎn)量也是有限的,大部分的媒體資源都投入進了用戶關注度大的領域,在新聞生產(chǎn)過程中,具有新聞價值的會排在前列。而只有少部分用戶關注的新聞得到的投入?yún)s很少,機器新聞的極高產(chǎn)量可以使得有多余的媒體資源投入進這些小眾的領域。生成更為豐富多元的內(nèi)容,滿足更多用戶的需求。機器新聞寫作具有省時高產(chǎn)的特性。2014年美聯(lián)社與AutomatedInsight公司達成合作,該公司開發(fā)的機器新聞寫作程序Wordsmith平臺參與“企業(yè)季度營收”的財經(jīng)新聞寫作,在使用這項智能程序后,美聯(lián)社在對于企業(yè)季度經(jīng)營狀況的新聞報道量激增,從之前的每季度300篇增加到每季度4400篇。據(jù)AutomatedInsight公司介紹,Wordsmith在2013年生產(chǎn)了3億篇各種類型的文稿,這種新聞內(nèi)容的生產(chǎn)高產(chǎn)出是記者能力所不能及的。同時,機器新聞寫作程序能夠用最少的人力和物力來完成最眾多的寫作任務。以最低成本獲得最大效益、實現(xiàn)資源的最大化利用,這是人類執(zhí)追求的目標,人工智能技術正是能夠助力人類實現(xiàn)這一目標,用機器代替人力勞動已成為一種趨勢。在信息化的時代,人類對于信息的需求量激增,人們無時無刻不在閱讀著大量的信息,需要大量的文字工作者進行內(nèi)容的創(chuàng)作才能滿足于人類的信息需求。機器新聞寫作的內(nèi)容創(chuàng)作由人工智能程序來進行,可24小時全天候的運作,節(jié)省了大量的勞動力成本。更重要的是機器新聞寫作可把大量從事基礎性消息寫作的記者解放出來,讓他們從事更

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論