數億網民數據將被用來訓練AI?谷歌新隱私政策引發爭議!

2023-07-11 18:40:07    編輯: robot
導讀 彼之砒霜,我之蜜糖。 從ChatGPT出現到目前爲止,大大小小的大模型一只手已經數不過來了。不管這些模型參數規模大小,上察天文,下曉地理,總能找出來一個符合應用場景的。這樣的“外掛”說成是解放生產力...

彼之砒霜,我之蜜糖。

從ChatGPT出現到目前爲止,大大小小的大模型一只手已經數不過來了。不管這些模型參數規模大小,上察天文,下曉地理,總能找出來一個符合應用場景的。這樣的“外掛”說成是解放生產力,也不算爲過。

但一家歡喜一家愁。在大模型一路狂奔的背後,那些支持他們訓練的數據來源,也成了業內心頭一直放不下的障礙。鑑於OpenAI、谷歌等一衆巨頭一直以來“白嫖”的優良傳統,各個數據源頭如Twitter、Reddit等知名社交平台和社區,都表示:想用我的數據可以,把錢拿來!

這下AI巨頭們反倒被數據源牽着鼻子走了,但是有人偏偏不信這個邪。

近日,搜索引擎巨頭谷歌宣布:以後只要是發布在網上的信息,谷歌都可以拿來訓練AI!不管是語言模型,只要是和AI相關的服務,都在允許範圍內。

谷歌新政策一出,業內徹底炸开了鍋!

堂而皇之“侵犯隱私”,還能合規合法?

AI訓練“侵犯隱私”的輿論正鬧得沸沸揚揚,谷歌卻頭鐵得出台了新的隱私政策,想借此給自己套上免死金牌。

近日,谷歌更新隱私政策,表示將利用網絡公开數據訓練旗下的AI模型。

其中,谷歌在新隱私協議的“可公开獲取的資源”中聲明:“我們可能會收集公开的在线信息或來自其他公共來源的信息,幫助訓練Google的AI模型。”該大模型將會爲谷歌翻譯、谷歌旗下聊天機器人產品“Bard”及Cloud AI等產品和功能提供支持。

去年年底谷歌就更新了一版隱私政策。對比上一版,谷歌將“收集信息以幫助訓練語言模型”的相關措辭更改爲“訓練人工智能模型”,並新增明確了自家AI產品對於數據的使用權利。

這似乎意味着,谷歌在訓練旗下聊天機器人及其他AI模型,或未來开發AI產品的過程中,有權使用人們在網上公开發布的任意內容,什么“版權”、隱私在該政策面前統統不存在了。

經確認,7月5日,谷歌中文版隱私政策也已經進行同步更新。

谷歌的這項政策沒有針對誰,指的是在座的所有網民。只要你在網上發表了什么內容,谷歌都可以拿來訓練AI。消息一出,網上瞬間炸开了鍋。

“版權已死” “隱私不在”等等悲觀情緒不一而足,更有的直言“AI正在吞食一切”。

但也有人認爲,谷歌的此項舉措並沒有嚴格意義上的“違規違法”。有相關律師表示,“無論在我國還是域外,對公开數據的正常收集和使用,在一般情況下不算違法。”但是他還說,一旦個人通過郵件等方式明確拒絕了此項政策,那就另當別論了。

其他法律人士表示,就目前可獲得的信息而言,谷歌對收集與處理用戶個人信息的範圍和目的作出了詳細說明,即使以歐盟GDPR項下更爲嚴格的“告知-同意”規則爲標准,谷歌的這一收集與處理行爲至少在形式上具有合法性。

只是在實際施行中涉及的行爲是否合法,還需進一步確認。

AI巨頭們的“數據之战”

單純看谷歌的一系列操作,可能覺得有些無釐頭。但有意思的是,就在谷歌更新隱私政策前不久,另外一個AI巨頭就被起訴“侵犯隱私”。

兩名美國作家在舊金山聯邦法院對OpenAI提起訴訟,聲稱 OpenAI 沒有獲得版權授權,就濫用他們的作品來訓練人工智能。

起訴書中顯示,OpenAI 的訓練數據超過 30 萬本書,其中就包括本就飽受爭議,版權歸屬不清晰的“影子圖書館”(大多是以侵犯版權的方式向公衆免費提供書籍文獻內容的线上網站)。

此前OpenAI和微軟還被16 位匿名人士要起訴,因爲這兩家公司沒有經過他們的同意就泄露了他們的個人隱私,要求兩家賠償30億美元。

這么看來,谷歌此舉反倒有一種“自保”的意圖。

而另一方面,則更加突出了AI大潮之下,數據的重要性。各家都在保衛和爭奪“數據”中絞盡腦汁。

Reddit採取的方式簡單粗暴,就是提高API價格。Twitter則是限制數據的曝光,CEO馬斯克近日宣布 Twitter 將“臨時限制”用戶每日閱讀推文數量:未驗證的账戶每天只能看到 600 條推文,對於新的未驗證账戶,一天只能看到 300 條。經過驗證的账戶每天只能閱讀 6000 條帖子。

當各家AI的發展進度逐漸持平以後,算力和參數都漸漸被弱化。接下來的競爭,就看誰能更快更多地獲取到“高質量”數據了。



標題:數億網民數據將被用來訓練AI?谷歌新隱私政策引發爭議!

地址:https://www.utechfun.com/post/236608.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡