AIGC風控前瞻:給數據“打上水印” 全鏈路多維度“排雷”

2023-07-12 19:03:05    編輯: IT時報
導讀 作者:郝俊慧 來源:IT時報   剛剛落幕的世界人工智能大會(WAIC 2023)在上海掀起了一股AI颶風。AIGC、大模型、算力、芯片……與會者熱烈地討論着一個新時代的开始。然而,在AIGC將如何...

作者:郝俊慧 來源:IT時報

  剛剛落幕的世界人工智能大會(WAIC 2023)在上海掀起了一股AI颶風。AIGC、大模型、算力、芯片……與會者熱烈地討論着一個新時代的开始。然而,在AIGC將如何改變未來的喧囂背後,是更多對人工智能風險應有的冷靜。

  一系列舉措正在緊鑼密鼓地出台。

  當地時間6月14日,歐洲議會以499票贊成、28票反對和93票棄權,高票通過了《人工智能法案》(AI Act)談判授權草案,草案對通用人工智能(general purpose AI)的透明度提出了明確要求。

  6月20日,中國首批境內深度合成服務算法備案清單出爐,百度、阿裏巴巴、騰訊、字節跳動、美團等26家公司、共計41個算法榜上有名,這個清單被認爲是4月11日國家互聯網信息辦公室發布的《生成式人工智能服務管理辦法(徵求意見稿)》(下稱《辦法》)的試水。

  無論是越來越逼真的換臉和換聲,還是隱藏於各家語言大模型中的“偏見”,安全被認爲是進入AI新世紀之前必須先設置的保險槓。

AIGC風控必須全鏈路

  “AIGC帶來豐富創造力的同時,也帶了全新的內容安全挑战。”騰訊安全內容風控產品經理李鎬澤日前在接受包括《IT時報》記者在內的媒體採訪時表示,當大模型逐漸落地時,一定要考慮全鏈路風控。

  相對過去以PGC、UGC爲主的內容,AIGC時代的內容安全內涵與外延均有顯著變化。從訓練到生成到事後,處處都可能有“雷點”。

  高質量數據是確保“黑盒子”大模型輸出效果的關鍵。中國科學院自動化研究所研究員、人工智能倫理與治理中心主任曾毅認爲,基於人類訓練的AI可以習得社會的偏見、仇恨,甚至是歧視,人工智能技術並非中立。

  這意味着,在內容生成階段,涉及個人隱私、虛假、違背倫理、不適內容、未成年人等違規內容都必須被“剔除”。

  目前公开測試通用大模型中,並無廠商主動對外公布自己的訓練數據來源,基本公認的來源有三個:網絡爬蟲、公共語料庫以及人工標注的數據。如果不對數據源進行初審,便很容易在結果中涉嫌違規。

  比如,如果已被泄露的明星個人數據庫在某個網站上被爬蟲抓到,並進入大模型訓練庫,那很可能出現的場景是,當被提問“****的手機號碼是多少?”時,大模型直接給出答案。

  “訓練大模型的廠商,要嚴控構建模型數據源的真實、無害和可用性,包括個人隱私的脫敏、不涉及相關偏見以及本身內容合法和規範等等。”騰訊安全天御研發工程師周維聰告訴記者。

  內容生成階段的風險也同樣存在。前段時間出現的換臉、假聲紋便屬於此類,加上ChatGPT“一本正經胡說八道”的偶發症狀,這個階段的安全風險最爲集中。此外,產品上线後,用戶也一定要時刻關注輿情,關注大模型生成的內容是否違規,是否引發輿論關注,風控的那根“弦”要始終繃緊。

  6月19日,騰訊雲正式公布MaaS(Model-as-a-Service)能力全景圖,並表示,依托騰訊二十余年的安全經驗和天御大數據能力,提供AIGC全鏈路內容安全解決方案,確保大模型可信、可靠、可用。

  據了解,騰訊安全AIGC全鏈路內容安全解決方案,提供包含審校服務、安全專家服務、機器審核服務、版權保護服務四大能力板塊,覆蓋AIGC類應用從模型訓練到內容生成到事後運營全過程的內容安全建設。  

AIGC生成內容或需標示

   WAIC上,中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起《AIGC可信倡議》,提出構建AIGC可信發展的全球治理合作框架,採用安全可信的數據資源、技術框架、計算方法和軟件平台等全面提升AIGC可信工程化能力,最大限度確保生成式AI安全、透明、可釋。

  對於AIGC將帶來怎樣的未來,從業者無法預知,只能通過自律控制“魔法”,而不久的將來,法律將正式落地。

  《人工智能法案》新增了對通用人工智能的透明度要求,比如大模型訓練時如果使用了受版權保護的數據,需要公开訓練數據的詳細信息,而且基於基礎模型的生成式AI必須要對生成的內容進行標注,幫助用戶區分深度僞造和真實信息。

  《生成式人工智能服務管理辦法(徵求意見稿)》也提出了類似的要求,一方面,提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責,另一方面,提供者應當按照《互聯網信息服務深度合成管理規定》對生成的圖片、視頻等內容進行標識。

  李鎬澤認爲,未來可能要從技術和監管多維度實現AIGC的透明化,比如通過對數據來源的強監管,確保輸出內容的生成標示,“此外也可以通過數字水印等技術手段,確保數據可溯源。”

  目前,針對AIGC引發的版權保護難題上,騰訊安全建立了版權資產統一ID庫,助力企業進行版權原創性篩查;此外,騰訊安全還提供“檢測、比對、維權”的全鏈路版權保護服務,並在AIGC內容安全領域有多個場景實踐落地,爲文生文、文生圖、醫療級視頻內容、長小說文本等類型企業提供內容安全服務。

追加內容

本文作者可以追加內容哦 !



標題:AIGC風控前瞻:給數據“打上水印” 全鏈路多維度“排雷”

地址:https://www.utechfun.com/post/237138.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡