文/陳根
AIGC在新聞領域的應用,正在引起廣泛的擔憂。
近日,美國最大新聞出版商Gannett宣布,將暫停使用人工智能工具撰寫體育新聞。而此前,該公司由LedeAI撰寫的報道則在社交媒體上瘋傳,引發了大量網友的討論和嘲諷。網友評價稱,這些AI所發布的報道缺乏關鍵細節,內容大量重復,使用奇怪的語言,並且讀起來就好像從未看過有關的體育比賽一樣。
要知道,2022年底,OpenAI剛剛發布ChatGPT時,人們還滿心期待ChatGPT能給新聞採編帶來前所未有的解放和效率提升。從滿心期待到受到群嘲,人工智能還能改變新聞業嗎?人們還放心將人工智能引入新聞業或者其他行業嗎?
“海嘯”即將來臨
人工智能對新聞行業最大的改變,就是推動了新聞自動化生產的發展,而這一改變從十年前就已經开始。
美聯社是最早利用人工智能和自動化來支持其核心新聞報道的新聞媒體之一。2014年,美聯社开始使用人工智能程序處理有關企業收益的報道,令新聞業面貌爲之一新。
在使用人工智能之前,美聯社的編輯和記者在其中花費了無數資源制作財務報告,也因此分散了對有更大影響力的新聞的關注。即使大量投入,美聯社每季度也只能制作300份財務報告,還有數千份潛在的公司收益報告未能成文。採用人工智能平台Automated Insights的Wordsmith,他們在幾秒鐘內就可以將那些投資研究的收益數據轉換爲可發布的新聞報道,效率大大提升,美聯社制作的季度收益報告一下子達到4,400個,效率是手動工作的近15倍。
當然,美聯社只是使用人工智能的一家媒體,實際上,同時期使用人工智能的媒體還包括彭博社、路透社、福布斯、紐約時報、華盛頓郵報、英國廣播公司等大型媒體。這些大型媒體的人工智能應用主要是將機器學習運用於採集、制作和分發新聞等各個流程。
比如,華盛頓郵報利用名爲Heliograf的自動化編輯器,使得機器可以生成簡單的新聞故事,尤其是涉及大規模的數據報告或比賽統計數據。
福布斯業推出了一個名爲“Bertie”的全新網站, Bertie是一個AI內容發布平台,該網站採用內容管理系統驅動,專門爲內部新聞編輯室和合作夥伴打造。通過Bertie,可以生成更具吸引力的標題,進行圖片與故事內容的精准匹配,還能對閱讀難度進行評估。
對於國內的媒體機構來說,早在2015年,騰訊財經就已推出自動化新聞寫作機器人Dream Writer,據Dream Writer的研發團隊透露,它的內容生產方式主要是基於大數據分析平台,在短時間內選出新聞點、抓取相關資料,通過學習固定的新聞模板生成稿件,它的優勢在於適用在信息量巨大的財經資訊類新聞,在准確率和時效性上都完勝人類記者編輯。
除了騰訊Dream Writer,類似的還有新華社的機器新聞生產系統“快筆小新”。它通過對數據採集、加工,並進行自動寫稿、編輯籤發,以最快的速度地完成例如體育賽事、中英文稿件和財經新聞的自動撰寫等。
不過,在大模型還未爆發之前,相比普通的新聞記者,人工智能新聞採編雖然在時效性、准確性上更具優勢,還處於比較基礎的狀態,缺乏共情力、調查力、創造力和思想力,能做到效率的提高,還未能進行更加深度的分析和解釋,因此很難寫出富有創意的報道。
直到2022年以來,以ChatGPT爲代表的大型語言模型和基礎模型得到突破性進展,人工智能新聞採編才有了明顯的改變。和過去的任何一個人工智能產品都不同,以ChatGPT爲代表的大型語言模型擅長於各種各樣的任務,並且展現出不輸於人類的性能和水平。
英國的新聞網站journalism.co.uk在今年1月專門發表了一篇文章,總結了ChatGPT可以爲記者完成八項任務:生成大文本和文檔的摘要;生成問題和答案;提供報價;制造標題;將文章翻譯成不同的語言;生成郵件主題和寫郵件;生成社交帖子;爲文章提供上下文。美國《內幕》(Insider)全球總編輯卡爾森甚至將ChatGPT稱爲“海嘯”:海嘯即將來臨,我們要么駕馭它,要么被它消滅。他認爲人工智能會讓新聞業變得更快更好。
ChatGPT給新聞業帶來了什么?
ChatGPT橫空出世,對新聞業的震撼非同小可。
在國際上,許多媒體已經开展了相關嘗試。新聞聚合網站BuzzFeed發布由AI作答的測試欄目quizzes,並表示將使用AIGC編寫測試類內容,以替代部分人力。5月24日,《華盛頓郵報》宣布成立跨部門AI協同機制,包括战略決策團隊AITaskforce和執行團隊AIHub,以更好地適應AI創新實踐。國內媒體如澎湃新聞、封面新聞、上遊新聞等百余家媒體機構在今年2月宣布接入AIGC產品。
新聞工作者已經從ChatGPT獲得助力。《紐約時報》觀點專欄作家曼珠認爲,ChatGPT這樣的應用將成爲許多記者工具包的常規應用。他在自己的文章將ChatGPT比喻爲新聞工作者獲得的新型噴氣飛行器,雖然有時它會崩掉,但有時它則會翱翔、升騰,能夠在幾秒鐘、幾分鐘內完成過去數小時才能完成的任務。
目前,以ChatGPT爲代表的AIGC對於新聞業的影響主要集中於新聞生產階段。而隨着ChatGPT等AIGC技術能力的提升以及應用程度的加深,它對於新聞業的影響也會日益深化。
一方面,AIGC將優化新聞信息的採集與處理。借助plugins等插件,ChatGPT可以快速抓取和採集海量數據,並進行自動處理,如快速瀏覽文本和生成摘要,爲新聞工作者提供有力的數據分析,從而提供見解或啓發,幫助記者尋找更獨特的角度、更有洞察力的思考方向。這種能力提供了一種提升信息獲取效率的可能,在資料檢索階段,記者和編輯無需閱讀大量全文資料,而可利用ChatGPT的數據分析和語義分析能力生成摘要,快速獲取核心信息,以提高工作的效率。
ChatGPT的語言生成能力還可用於翻譯跨語言文本,方便記者和編輯獲取不同語種的資料與信息。同時,AIGC工具能輔助記者進行採訪音視頻內容識別與整理,提高生產力並優化創作流程。
另一方面,AIGC還能直接進行新聞內容的生成,提升報道效率。
ChatGPT具有較強的學習能力和文本生成能力,在聯網之後,還能迅速採集互聯網資料進行新聞內容的生成。通過提示詞的設置,ChatGPT還可以生成特定風格的新聞報道。除此之外,ChatGPT可以應用於生成訪談提綱、文章框架和標題等內容,還能將新聞報道翻譯成多種語言,打破語言邊界。
部分媒體已將AIGC納入到新聞內容的生產流程中。如BuzzFeed將ChatGPT用於測驗類內容的生成;2023年情人節前,《紐約時報》使用ChatGPT創建了一個情人節消息生成器,用戶只需要輸入幾個提示指令,程序就可以自動生成情書;德國出版集團AxelSpringer和英國出版商Reach,近期也在地方新聞網站上發布了由AI撰寫的文章。
全球首個完全由人工智能生成新聞報道的平台NewsGPT.com也已經上线。根據聲明,該網站沒有人工記者,由NewsGPT實時掃描、分析來自世界各地的新聞來源,包括社交媒體、新聞網站等,並創建新聞報道和報告。其創始人聲稱,NewsGPT“不受廣告主、個人觀點的影響”,7*24小時提供“可靠的”新聞。
不准確的假新聞?
看起來,ChatGPT等生成式人工智能爲新聞業的效率與革新帶來了前所未有的發展,但在機會到來的同時,挑战也在到來。
究其原因,ChatGPT等生成式人工智能本質上依然只是通過概率最大化不斷生成數據而已,而不是通過邏輯推理來生成回復。
由於數據和模式的種種缺陷,生成式人工智能存在系統性偏見、價值觀對抗、“觀點霸權”、刻板印象、虛假信息等問題。而模型本身也有其局限性。大型語言模型缺乏常識性的推理能力,由此帶來了其能力的局限性。這類局限的最大困境是:生成式人工智能不理解其生成的文本的含義。
當生成式人工智能面對細微差別、歧義或諷刺之類的內容時,它難以理解其中的真實意義;它可以生成似是而非但不正確甚至荒謬的文本;它無法驗證其輸出的真實性;它的輸出可能是公式化的,可能會單調乏味、缺乏想象力;它可以生成帶有偏見、歧視性或有毒的文本。這也就是所謂的AI幻覺,即人工智能的“胡言亂語”。
然而,對於專業媒體來說,新聞報道最重要的就是嚴謹性和真實性,任何新聞報道都要對讀者負責,也要爲機構聲譽負責,信息源混亂的AIGC顯然不是理想的選擇。如彭博傳媒首席數字官JuliaBeizer所評價的,媒體的定位是爲讀者提供基於事實的信息,但AI並不足以作爲准確的信息源。這就意味着,一旦AI幻覺問題無法獲得有效的解決,AI編寫新聞將會成爲假新聞的源發地。
2023年,美國科技新聞網站CNET.com一度上线了幾十篇由AI生成的文章,盡管網站編輯聲稱文章在發布之前都經過了“核查和編輯”,但是很快讀者發現,這些文章中有大量基礎性錯誤,並且其中一半都存在抄襲和剽竊的問題。
這也是爲什么美國最大新聞出版商Gannett宣布,將暫停使用人工智能(AI)工具撰寫體育新聞的原因。Gannett發言人聲稱,已經暫停了所有使用LedeAI的服務與試驗,除了在全國增加數百個報道崗位外,還會加強人工智能工具,以確保提供的所有新聞和信息都符合最高的新聞標准。LedeAI首席執行官Jay Allred對Gannett報紙上的文章“包含錯誤、不必要的重復和尷尬的措辭”表示遺憾,並補充說該公司“正在全力以赴糾正問題並做出適當的改變。”
新技術的應用,往往會帶來顛覆性的變化。正如媒介學者約書亞·梅洛維茨所言:任何一種媒介的介入,都會創造出全新的環境。盡管目前AIGC還存在着一些問題,但這並不阻礙人工智能技術取代新聞採編工作的趨勢。面對來勢洶洶的AIGC浪潮,新聞業無法置身事外,勢必也將被卷入其中,甚至被徹底重塑。但在此之前,我們仍需謹慎面對技術帶來的風險,審慎回應技術帶來的挑战。
原文標題 : 陳根:從滿心期待到受到群嘲,AI還能改變新聞業嗎?
標題:從滿心期待到受到群嘲,AI還能改變新聞業嗎?
地址:https://www.utechfun.com/post/260446.html