對話多位相關從業人士,AIGC監管迎來新時代?

2023-08-01 18:40:03    編輯: robot
導讀 2023年7月13日,國家互聯網信息辦公室等七部門聯合發布《生成式人工智能服務管理暫行辦法》(以下簡稱“《辦法》”)。 《辦法》針對從去年起成爲科技圈頂流的生成式人工智能行業提出了監管辦法。 202...

2023年7月13日,國家互聯網信息辦公室等七部門聯合發布《生成式人工智能服務管理暫行辦法》(以下簡稱“《辦法》”)。

《辦法》針對從去年起成爲科技圈頂流的生成式人工智能行業提出了監管辦法。

2022年11月,ChatGPT發布之後,生成式人工智能迅速席卷整個互聯網行業。各大互聯網企業紛紛入局,截至目前,國內發布的10億參數規模以上的大模型就有超過100個,應用領域涵蓋搜索、對話、協助創作、媒體生成、教育、翻譯等。

艾媒咨詢預測,預計2023年中國AIGC核心市場規模將達79.3億元,2028年將達2767.4億元。

但自從ChatGPT一夜爆紅以來,由人工智能生成的虛假和錯誤信息屢見不鮮。同時生成式人工智能的出現,也嚴重衝擊了創作領域原有的生態,版權問題也讓全世界的立法機構也陷入了難題。

《辦法》的出台會解決這些問題嗎?對生成式人工智能行業有什么樣的影響?業內如何看待此次《辦法》的出台?

《銀杏科技》對話了多位相關從業人士,他們分別是高級算法工程師、自然語言處理高級研究員孫科、連續創業者譚偉、偉君律師事務所律師錢川。

他們表示,《辦法》的出台一方面降低訓練模型的門檻,促進了行業創新,同時還明確了算法的安全主體責任,要求企業在應用开發期間就針對算法進行安全評估。

對於“裸奔”了數個月的生成式人工智能行業來說,《辦法》出台意味着行業將迎來一個全新的發展階段。

以下爲部分對話實錄:

問:對於开發者來說,《辦法》的出台有什么樣的影響?

孫科:《辦法》出台之後,企業在开發產品的過程中需要提前做好規劃以應對生成式人工智能產品較長的开發流程和更多的合規控制點。

如果只是做ChatGPT這樣的聊天應用,除了算法備案之外,還需要遵守《網絡安全法》、《數據安全法》、《個人信息保護法》等多項法規,此外還需要ICP經營許可證、軟件著作權、網絡文化經營許可證、增值電信業務經營許可證等審批,如果要在其他領域還需要完成相應的許可和備案。

生成式人工智能的开發涉及到多個不同的環節,企業內部也需要對相應的環節進行規劃以滿足合規要求。

問:《辦法》爲什么要求將算法備案?具體要備案哪些信息?

孫科:算法備案制度本質是監管部門事前設置算法問責的問責點,用以確認算法推薦服務提供者是否履行了法律規定的各項義務,是否在算法的設計、運行和結果輸出層面有主觀過錯。

在具體實施上可能也會採取與推薦算法、深度合成算法類似的“大廠先行”模式,由互聯網大廠率先普及。生成式人工智能算法備案可能也並不需要公开算法機制,但同一App,甚至同一應用場景下的不同算法需要分別進行備案。

雖然在《辦法》中沒有明確細則,但參考此前的經驗,企業需要將名稱、服務形式、應用領域、算法類型、算法自評估報告、擬公示內容等信息進行備案,向監管主體提示算法可能存在的濫用、惡意利用、漏洞、違法和不良信息生成、傳播等違法違規的風險,並在服務網站和程序頁面上注明備案號和公示鏈接。

另外,生成的內容也需要進行標注。

問:對於創業者,《辦法》的出台會帶來什么樣的新機遇嗎?

譚偉:創業者可以將大模型必備的大量計算和數據資源成本降低不少。《辦法》提出,將推動生成式人工智能基礎設施和公共訓練數據資源平台建設、促進算力資源協同共享,提升算力資源利用效能。推動公共數據分類分級有序开放,擴展高質量的公共訓練數據資源。

和其他領域相比,人工智能,尤其是大模型生成式人工智能領域完全是一個重資產行業,沒有算力、沒有數據就沒有產品。

以目前行業內較爲熱門的开源大數據模型BLOOM爲例,這個高達1760億參數的大模型的訓練需要使用384個GPU,將花費3.5個月時間,僅硬件成本就高達576萬美元。如果將訓練時間縮短至24天,則需要1024個GPU,硬件成本超過1530萬美元。

《辦法》的出台一方面能夠降低計算和數據成本,另一方面利好共享算力服務提供商。

問:您的創業項目針對的是大模型的算力基礎設施,《辦法》會帶來什么樣的影響?

譚偉:對於大模型創業企業,硬件成本就能勸退大多數團隊了。我計劃組建一個類似於Folding@home的分布式計算網絡來支持大模型的訓練。

這是世界上最大的分布式計算項目,針對分子生物領域進行計算,它並不依靠強大的超級計算機進行計算,主要的貢獻者是成千上萬的個人電腦和遊戲機。

每部參與的電腦都安裝了一個在後台運行的客戶端程序,在系統不忙碌的時候調用中央處理器運行模擬工作。現時世界上絕大部分的個人電腦,在一般的情況下都很少用盡本身的計算能力。

Folding@home就是使用這些本來都浪費了的運算力量。Folding@home是第一台千萬億次級計算機,每秒能夠執行一百萬億次運算,最近還成爲了第一台超大規模計算機,每秒可執行十億億次運算。

類似的分布式計算項目其實不少,但針對大模型訓練的並不多,《辦法》的出台是一個入局的好機會。

問:爲什么《辦法》並沒有強調生成式人工智能涉及到的版權問題?生成作品的知識產權應該歸屬於誰?

錢川:《辦法》並未在知識產權方面對生成式人工智能進行過多限制,還是希望能夠鼓勵企業在該領域的創新,开發出自主可控的生成式人工智能產品,避免“不管就亂,一管就死”。

就目前情況而言,生成作品的知識產權問題暫時沒有一個完善的解決方案。大多數國家依然按照以往的規定來界定生成作品的版權。

著作權法意義上的作品應滿足以下四個條件:由人類創作,具有獨創性,是蕴含一定思想內容的表達形式,且不屬於法律法規、通用數表、公式等著作權法排除對象。

完全由人工智能獨立創作或按照自然人輸入的提示詞生成的作品,是無法在法律上被稱爲 “作品”的。人工智能並未被界定爲人類,不享有人權,當然也不擁有版權,更不用說歸屬與誰了。

問:訓練人工智能時使用了他人公开在互聯網上的作品,創造出AI孫燕姿、AI畢加索,此類行爲是否侵犯了知識產權?

錢川:訓練人工智能使用的數據知識產權保護暫時沒有成功案例。目前只有具有數據產權的數據庫可能會受到保護。

一方面,數據產權的保護辦法我們還在探索當中,今年年初的數據二十條規定就是一個初步的方案。另一方面,目前國家知識產權局和深圳、上海已經开始研究數據的確權工作,但具體如何確權還需實踐。

       原文標題 : 對話多位相關從業人士,AIGC監管迎來新時代?



標題:對話多位相關從業人士,AIGC監管迎來新時代?

地址:https://www.utechfun.com/post/245000.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡