AIGC風控前瞻：給數據“打上水印” 全鏈路多維度“排雷”

2023-07-12 19:03:05 編輯： IT時報

導讀作者：郝俊慧來源：IT時報　　剛剛落幕的世界人工智能大會（WAIC 2023)在上海掀起了一股AI颶風。AIGC、大模型、算力、芯片……與會者熱烈地討論着一個新時代的开始。然而，在AIGC將如何...

作者：郝俊慧來源：IT時報

　　剛剛落幕的世界人工智能大會（WAIC 2023)在上海掀起了一股AI颶風。AIGC、大模型、算力、芯片……與會者熱烈地討論着一個新時代的开始。然而，在AIGC將如何改變未來的喧囂背後，是更多對人工智能風險應有的冷靜。

　　一系列舉措正在緊鑼密鼓地出台。

　　當地時間6月14日，歐洲議會以499票贊成、28票反對和93票棄權，高票通過了《人工智能法案》（AI Act）談判授權草案，草案對通用人工智能（general purpose AI）的透明度提出了明確要求。

　　6月20日，中國首批境內深度合成服務算法備案清單出爐，百度、阿裏巴巴、騰訊、字節跳動、美團等26家公司、共計41個算法榜上有名，這個清單被認爲是4月11日國家互聯網信息辦公室發布的《生成式人工智能服務管理辦法（徵求意見稿）》（下稱《辦法》）的試水。

　　無論是越來越逼真的換臉和換聲，還是隱藏於各家語言大模型中的“偏見”，安全被認爲是進入AI新世紀之前必須先設置的保險槓。

AIGC風控必須全鏈路

　　“AIGC帶來豐富創造力的同時，也帶了全新的內容安全挑战。”騰訊安全內容風控產品經理李鎬澤日前在接受包括《IT時報》記者在內的媒體採訪時表示，當大模型逐漸落地時，一定要考慮全鏈路風控。

　　相對過去以PGC、UGC爲主的內容，AIGC時代的內容安全內涵與外延均有顯著變化。從訓練到生成到事後，處處都可能有“雷點”。

　　高質量數據是確保“黑盒子”大模型輸出效果的關鍵。中國科學院自動化研究所研究員、人工智能倫理與治理中心主任曾毅認爲，基於人類訓練的AI可以習得社會的偏見、仇恨，甚至是歧視，人工智能技術並非中立。

　　這意味着，在內容生成階段，涉及個人隱私、虛假、違背倫理、不適內容、未成年人等違規內容都必須被“剔除”。

　　目前公开測試通用大模型中，並無廠商主動對外公布自己的訓練數據來源，基本公認的來源有三個：網絡爬蟲、公共語料庫以及人工標注的數據。如果不對數據源進行初審，便很容易在結果中涉嫌違規。

　　比如，如果已被泄露的明星個人數據庫在某個網站上被爬蟲抓到，並進入大模型訓練庫，那很可能出現的場景是，當被提問“****的手機號碼是多少？”時，大模型直接給出答案。

　　“訓練大模型的廠商，要嚴控構建模型數據源的真實、無害和可用性，包括個人隱私的脫敏、不涉及相關偏見以及本身內容合法和規範等等。”騰訊安全天御研發工程師周維聰告訴記者。

　　內容生成階段的風險也同樣存在。前段時間出現的換臉、假聲紋便屬於此類，加上ChatGPT“一本正經胡說八道”的偶發症狀，這個階段的安全風險最爲集中。此外，產品上线後，用戶也一定要時刻關注輿情，關注大模型生成的內容是否違規，是否引發輿論關注，風控的那根“弦”要始終繃緊。

　　6月19日，騰訊雲正式公布MaaS（Model-as-a-Service）能力全景圖，並表示，依托騰訊二十余年的安全經驗和天御大數據能力，提供AIGC全鏈路內容安全解決方案，確保大模型可信、可靠、可用。

　　據了解，騰訊安全AIGC全鏈路內容安全解決方案，提供包含審校服務、安全專家服務、機器審核服務、版權保護服務四大能力板塊，覆蓋AIGC類應用從模型訓練到內容生成到事後運營全過程的內容安全建設。　　

AIGC生成內容或需標示

　　 WAIC上，中國信通院、上海人工智能實驗室、武漢大學、螞蟻集團等多家單位共同發起《AIGC可信倡議》，提出構建AIGC可信發展的全球治理合作框架，採用安全可信的數據資源、技術框架、計算方法和軟件平台等全面提升AIGC可信工程化能力，最大限度確保生成式AI安全、透明、可釋。

　　對於AIGC將帶來怎樣的未來，從業者無法預知，只能通過自律控制“魔法”，而不久的將來，法律將正式落地。

　　《人工智能法案》新增了對通用人工智能的透明度要求，比如大模型訓練時如果使用了受版權保護的數據，需要公开訓練數據的詳細信息，而且基於基礎模型的生成式AI必須要對生成的內容進行標注，幫助用戶區分深度僞造和真實信息。

　　《生成式人工智能服務管理辦法（徵求意見稿）》也提出了類似的要求，一方面，提供者應當對生成式人工智能產品的預訓練數據、優化訓練數據來源的合法性負責，另一方面，提供者應當按照《互聯網信息服務深度合成管理規定》對生成的圖片、視頻等內容進行標識。

　　李鎬澤認爲，未來可能要從技術和監管多維度實現AIGC的透明化，比如通過對數據來源的強監管，確保輸出內容的生成標示，“此外也可以通過數字水印等技術手段，確保數據可溯源。”

　　目前，針對AIGC引發的版權保護難題上，騰訊安全建立了版權資產統一ID庫，助力企業進行版權原創性篩查；此外，騰訊安全還提供“檢測、比對、維權”的全鏈路版權保護服務，並在AIGC內容安全領域有多個場景實踐落地，爲文生文、文生圖、醫療級視頻內容、長小說文本等類型企業提供內容安全服務。

追加內容

本文作者可以追加內容哦 !

標題：AIGC風控前瞻：給數據“打上水印” 全鏈路多維度“排雷”

地址：https://www.utechfun.com/post/237138.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：港美

上一篇:復星醫藥(02196)：復星醫藥產業獲藥品注冊申請受理

下一篇:酷暑“助攻”制冷劑需求改善增長失速的東岳集團（00189）可否“撈底”？

您現在的位置：首頁名家專欄