被番茄小說當做AI訓練“花肥” 網文作者聯合說不

2024-07-29 18:41:26    編輯: robot
導讀 網文作者拒成番茄小說AI訓練“花肥” 。近段時間,不少網文作者在社交媒體發文控訴,番茄小說在籤約協議中,增加了“AI訓練補充協議”,要求作者同意把作品“授權”給平台的AI,用於內容开發。背刺平台作者...

網文作者拒成番茄小說AI訓練“花肥” 。近段時間,不少網文作者在社交媒體發文控訴,番茄小說在籤約協議中,增加了“AI訓練補充協議”,要求作者同意把作品“授權”給平台的AI,用於內容开發。背刺平台作者根據此次補充協議內容,作者完成籤署後,其作者全部/部分內容及相關信息,都將用於平台AI人工智能模型訓練,或者其他新技術研發應用場景。如若籤訂,作者後續“將優先參與平台AI新功能內測”。也就是說,番茄小說的作者,被迫同意補充協議後,其小說作品便被平台拿去“投喂”給大模型訓練。但他們並不能拿到更多收益,最多是獲得一個十分雞肋的新功能內測資格。實際上,早在2023年,就有作者在番茄小說的籤約協議中,發現涉及AI訓練的條款。當時並沒有被作者和業界廣泛關注。這次拿“作者小說訓練AI”事件之所以發酵,主要還是番茄小說的喫相過於難看,更多作者選擇停更、斷更和在社交平台發聲抗議,來和平台博弈、維權,要求解除AI協議。

網文作者在社交平台發帖截圖一方面,番茄小說合同中關於作品“投喂”AI的條款,隱蔽且“霸道”。不少作者是通過網絡帖子才注意到合同中的“霸王條款”。從作者發帖的內容可以看到,番茄小說的補充協議裏,並沒有明說平台不會把作品拿去訓練AI,但也沒有放棄尋求作者的同意,甚至在引導作者,讓渡自己的權益。

網文作者在社交平台發帖截圖另外一方面,面對“投喂”AI引發的爭議,番茄小說在相關論壇及其今日頭條官方账號進行回應,稱“官方沒有發布過任何純AI寫作的作品,也不會違背作者個人意愿使用AI寫作能力。如作者對協議有異議,可以盡快協助解除相關AI條款約定。”但平台作者們認爲,番茄小說回應所選擇的論壇和今日頭條账號,並不被所有人知曉。這個姿態,只是對外界的一個交代,不是直接觸達作者的信息渠道。因爲番茄小說平日給作者發信息的正規渠道都是站內信。

“這就是希望我們盡可能少關注到這件事的新聞或者帖子,盡量減少去主動解約作者人數。”有作者提到。此外,還有多位作者表示此回應避重就輕、玩文字遊戲:“沒發布過‘純AI’寫作的作品,意味着可能發布過大部分內容由AI生成的作品,比如真人搭框架,AI填內容。”隨着抵制和反對聲音的持續放大,番茄小說不得不上线合同條款解除功能,支持解除“AI訓練補充協議”。即便如此,解約也並沒有那么輕松。有作者發現,解約的操作入口很深。還有作者提到,他的解約申請16日已經提交,但至今還在待處理狀態。還有上百位博主發帖表示,與番茄小說解約後被限流,且沒有收到違反有關規則的通知。

不少作者更擔心被平台方起訴,泄露合同內容。一旦敗訴,賠償金也會是一筆不小的費用。在人工智能技術發展,AI創作大趨勢下,番茄小說推出AI輔助工具無可厚非,一定程度上也能提高網文作者的寫作效率。但番茄小說把AI補充訓練協議明確寫在作者合同中,沒有考慮作者的心情,強行把作者的勞動成果“投喂”給AI,不僅涉嫌侵犯內容版權,更是對他們的一種背刺。因爲對於很多網文作者來說,這是他們的謀生之路。如今在不知情的情況下,隨時可能被AI作者替代,何嘗不是第二個面對無人駕駛的網約車司機?

畢竟,原創作者堅持日更千字甚至萬字就極爲難得,而AI作者分分鐘就能“創作”出一本小說。經濟觀察網還提到,明確把AI條款寫進合同的,只有番茄小說一個平台。閱文集團、掌閱、七貓小說、中文在线等網文平台的作者和工作人員,他們均稱沒有見過類似AI條款。換句話說,直接宣布將語料“投喂”給大模型的平台, 目前僅有番茄小說一家。拿了你的東西,還不明確告知目的是什么。這也就能理解,番茄小說爲何在這輪風波中,被作者推到對立面,奮起落錘反抗。有作者便表示准備和小夥伴離开,“越了解AI寫作,越覺得番茄小說不把作者當人。

番茄小說的底氣雖然放在全球範圍看,AI創作引發的爭論和抗議早已有之。比如,2023年7月,出於對AI發展的忌憚,有着近16萬成員的好萊塢三大工會之一的美國演員工會(SAG-AFTRA)也出現過罷工現象,罷工人員曾在十數家制片公司外舉行抗議活動。再比如,2023年底,《紐約時報》就將微軟和OpenAI告上法庭,稱被告未經許可使用數百萬篇版權文章訓練AI模型,开發有競爭屬性的產品,賺取了豐厚的利潤,但嚴重威脅到了新聞從業者的生計,造成數十億美元的損失。在此之後,陸續有媒體加入到反抗的隊列。截至今年6月,至少已有12家新聞媒體機構對OpenAI和微軟提起了侵權訴訟。與之對比,番茄小說AI協議事件,可以定義爲是國內首例內容創作者聯合反對AI寫作的案例,值得網文行業以及AI從業者的反思。晉江文學城總裁劉旭東就表示,他並不鼓勵AI創作。人類作者參與這種行爲是飲鴆止渴。遲早有一天,平台會用自己訓練的AI虛擬作者代替人類作者。“如果這一天注定要到來,我希望來得晚一些”。

在他看來,網文平台看重AI,大部分是爲了降本增效。特別是在免費網文平台,有一些靠發錢吸引來的、對作品質量要求不高的讀者,他們需要“量大管飽”、品質不必太高的內容,而AI寫作的內容恰好能滿足這種需求。所以鼓勵AI創作就成了一些平台的導向。如其所說,網文平台布局AI已久。在番茄小說的AI條款發酵之前,包括字節跳動系、騰訊系、知乎在內的多家公司,都在投入以中文寫作爲核心能力的大模型。比如去年7月,閱文發布了國內網絡文學行業首個大模型“閱文妙筆”,並基於這一大模型推出應用產品“作家助手妙筆版”;知乎在2022年,作爲領投方,參與了AI創業公司面壁智能的天使輪融資。

此後,2023年11月,和面壁智能共同發布了“知海圖AI”中文大模型;“七貓”平台宣布基於跟百度的“文心一言”合作,爲作者提供了“AI助理”等相關輔助寫作功能,可以提供歷史文化信息、爲角色命名、生成場景描寫等。同時,撇除劉旭東觀點裏的“競品思維”,有一點是客觀的。番茄小說成立不過5年,便超越閱文(起點)、晉江等老牌網文平台,一躍成爲用戶最多的免費小說平台,靠的就是“免費、量大、管飽”的策略。這放在字節跳動“App工廠”體系內,其增長策略和今日頭條、抖音如出一轍:用戶看書不花錢,還能通過不斷地刷時長,獲得積分、金幣甚至返現獎勵,番茄小說憑借用戶規模獲得廣告收益。這個模式也被業界評價爲,“用戶沒有花錢买商品,因爲用戶就是被賣掉的商品”。

調研機構QuestMobile數據顯示,番茄小說位列2023年12月國內數字閱讀行業MAU(月活躍用戶數)規模首位,MAU爲1.92億,同比增長35.8%。另據晚點LatePost曾披露,2023年,番茄小說的收入已經超過 100 億。“挾流量以令作者”,這或許是番茄小說的底氣。

大模型的中文語料焦慮目前來看,AI替代的問題是一個全球性也是時代性的爭論話題。由番茄小說AI訓練協議推高的,關於平台用作者內容投喂AI是否侵權以及如何界定、AI是否會革了網文作者的“命”、AI對內容創作影響有多大等問題的探討,短期內難以有一個共識的答案。但可以確定的是,當下沒有誰,包括內容創作者群體,愿意被動的成爲AI訓練的“花肥”,自然會站出來說“不”。番茄小說“頂風作案”還引發一個關鍵問題:字節大模型的語料不夠“喫”了,正面臨着語料短缺的焦慮。今年5月,字節跳動發布豆包大模型,官方宣稱,豆包大模型正成爲國內使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。番茄小說是其接入的50余個業務之一。

番茄小說基於豆包大模型的AI功能箱擴充——番茄小說上线了AI擴寫、AI改寫、自定義描寫、AI續寫、AI起名、卡文錦囊、AI助手七大功能——自然需要更多的文字作品來喂養,也需要更多數據來支撐AI寫作,平台作者便成爲所需“花肥”。

事實上,在番茄小說AI訓練補充協議上线之前,豆包的語料庫中,已經疑似被投喂了全網的免費、付費文學作品。藍鯨新聞報道,有番茄小說作者提到,在豆包搜索個人在起點上架的小說內容時,也能搜索到有關內容。該作者懷疑在番茄小說的實名注冊信息被泄露,各大平台以自己不同網名來寫作的內容都已經被抓取。

網友質疑平台出現AI作者洗稿抄襲。圖源:界面新聞還有作者爆料,WPS疑似將自己的審籤內容喂給了豆包,稱“我才發表到35章,豆包章綱直接給我擴到90章。我的細綱裏中後期劇情還沒發表出去,豆包都出章綱了,那些劇情還和我大綱的劇情一模一樣,只有順序有點亂。”對此,豆包也發布聲明稱,傳言完全不實。豆包上部分書目信息,來源於公开信息,豆包也會給出相關網站信息;豆包與WPS在AI訓練層面並未开展任何形式的合作,也沒有使用任何用戶未公开的私人數據進行訓練。

抖音也進一步明確,作者問詢相關書目信息,豆包是基於公开搜索結果呈現作品及概述,不存在盜用信息行爲。番茄小說對於已經籤署補充協議、或籤約條款中包含AI條款的作者,已开放相關通道,將協助作者盡快解除相關AI條款約定。但這並沒有打消作者和業界的疑慮。信奉實用主義的字節,此前就有過類似的“騷操作”。今年5月,豆包被爆出將AI自問自答的內容生成靜態網頁,利用搜索引擎提高排名曝光,從而吸引流量。比如,當有人問AI搜索軟件Perplexity一個無釐頭的問題:“林黛玉的性格和魯智深的性格有什么相似之處”時,答案其中一個信息源,竟然是豆包和用戶的聊天記錄。

要知道,數據是支撐大模型發展的核心要素之一,語料即是大模型訓練所需要的數據,是巧婦下廚的“米”。同時,語料的質量會顯著影響大模型的性能。數據質量低,輸出的結果必然會是“垃圾內容多”。唐辰注意到,阿裏研究院在最近發布的《大模型訓練數據白皮書》中提出,互聯網上中文語料和英文語料佔比存在顯著差異:在全球網站中,英文佔比高達59.8%,而中文僅佔 1.3%。商湯科技大裝置事業群高級總監張行程表示,中文高質量語料相對缺乏是國內外大模型面臨的共同問題。中文語料庫不僅規模較小,且其電子化和網絡化程度明顯不足。此外,受版權、隱私等限制,許多優質中文語料庫也無法公开獲取。

去年,閱文在推出“閱文妙筆”時,就被問詢其素材來源,但相關負責人不予置評。從這點上看,字節跳動正面臨中文語料短缺的問題,也是國內所有大模型廠商的共同困境。而這,也是主張“大力出奇跡”的字節跳動,爲實現大模型訓練的可靠性甚至領跑行業,才跑偏了,不顧一切的將網文作者、作品作爲“花肥”,投喂給AI的根本原因。參考資料:中國企業家雜志,《3個月上架222本書,番茄小說疑似“進化”出AI作者》科技日報,《大模型發展提速 中文語料夠“喫”嗎》

       原文標題 : 被番茄小說當做AI訓練“花肥” 網文作者聯合說不



標題:被番茄小說當做AI訓練“花肥” 網文作者聯合說不

地址:https://www.utechfun.com/post/403724.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡