AIGC重塑數字人:落地、變革、永生

2023-05-17 18:40:05    編輯: robot
導讀 文/VR陀螺 豌豆 AIGC(生成式人工智能)在全球範圍內火了一把,據瑞銀發布的一份研究報告顯示,自ChatGPT推出兩個月後,月活躍用戶估計已達1億,成爲歷史上增長最快的消費應用。 圖源:Goog...

文/VR陀螺 豌豆

AIGC(生成式人工智能)在全球範圍內火了一把,據瑞銀發布的一份研究報告顯示,自ChatGPT推出兩個月後,月活躍用戶估計已達1億,成爲歷史上增長最快的消費應用。

圖源:Google Trends

創造了多項“神話”的AIGC,一度引發全民對“被替代”“被失業”的擔憂,以快速成長的ChatGPT爲代表的大模型自然也受到了各企業的關注,百度推出“文心一言”以來,大模型遍地开花,包括華爲、阿裏、京東、商湯等科技公司陸續推出了各自的大模型項目。

面對日益興起的AIGC,國家互聯網信息辦公室就《生成式人工智能服務管理辦法(徵求意見稿)》(以下簡稱《徵求意見稿》)向社會公开徵求意見。整體來看,《徵求意見稿》更多的是爲規範我國人工智能、算法等行業的發展帶來了更爲細致且明確的規範指導。

AIGC有着能在各行各業賦能的強大功能,ChatGPT富有創造性的對話讓人不禁遐想,在元宇宙時代,數字人將成爲非常關鍵的角色,AIGC與數字人的結合又會對現實世界帶來怎樣的變化?

 數字人走向各行各業,AI方向前景廣闊 

據IDC發布的《中國AI數字人市場現狀與機會分析2022》報告中,預計到2026年中國AI數字人市場規模將達到102.4億元人民幣。可見AI數字人前景之廣闊。

圖源:IDC

數字人最初應用於影視、遊戲行業,隨後落地到各行各業,在應對更復雜的情況時,人們對數字人的信息處理能力、即時互動能力以及表達能力等需要有更高的要求。

陀螺研究院發布《2023年全球虛擬數字人產業報告》,其指出虛擬數字人的每個發展階段與時代背景,技術有緊密聯系,至今已邁入成長階段,2023年Open AI推出的聊天機器人ChatGPT,與真人之間展开“靈活機智”對話,給由AI驅動的虛擬數字人描繪了極大創作及交互想象空間,伴隨着ChatGPT成熟應用,虛擬數“智”人將走向大衆生活。

圖源:陀螺研究院

如今AI對傳媒、影視、藝術、電商、娛樂、遊戲等領域已經產生了重要的影響。數字人需要更智能、更人性化,有更真實的表現力。

 AI賦能數“智”人,加速打破次元壁 

如果好看的外形是數字人的“名片”,那么AI將成爲數字人的“內核”。AI賦能數字人,未來能實現文本生成、音頻生成、圖像生成、視頻生成、3D模型生成等功能,延伸到多模態交互功能,進而實現跨維度升級。

在外形方面,AI技術幾乎滲入到數字人構建的各個基礎環節:建模、生成、渲染、驅動、呈現、交互等方面,目前已經能呈現高保真的“人類”外形,也能做出流暢的肢體語言,如虛幻引擎的Metahuman和數年前三星演示的NEON數字人。

NEON數字人(圖源:網絡)

爲了提高數字人的真實度,前段時間英偉達更新了其Omniverse的AI能力,並宣稱將進一步引入對生成式AI的支持,用戶可以僅憑文本信息自動生成高質量的材料。這一特性在Omniverse的聲音驅動面部表情的工具Audio2Face上面也有體現。

高保真AI數字人(圖源:英偉達)

爲了演示Omniverse的新特性, Adobe Substance 3D藝術和开發團隊使用Omniverse USD Composer(前稱Create)合作創作了一個虛擬數字人形象。從視頻可以看到,裏面的虛擬角色視效逼真,並且皮膚呈現了真實的光线效果,而生成式AI,則提升了面部表情以及脣形同步的質量。相關閱讀:《AI含量極高,GTC 2023有何新動態?》

在數字人制作方面,AI的接入讓其生產成本進一步降低。

3月,騰訊發布全新的AI智能創作助手“騰訊智影”,智影數字人能實現“形象克隆”和“聲音克隆”,創作者通過上傳少量圖片、視頻和音頻素材,就能得到自己的數字人分身和定制音色,進而快速生成自己的數字人播報視頻。據介紹,騰訊智影還接入了數字人直播,可實現7×24小時不間斷开播。

來源:騰訊智影

商湯科技在4月的技術交流日活動上發布了大模型體系“商湯日日新大模型”,其演示了2D數字人視頻生成平台“如影SenseAvatar”,據稱僅需一段5分鐘的真人視頻素材,就可以生成出來聲音及動作自然、口型准確、多語種精通的數字人分身。它可應用爲智能直播、教學、短視頻等多種場景。

來源:商湯科技

在功能方面,結合ChatGPT的數字人不僅能完成更細致的指引、導航等信息提示服務工作,結合龐大的知識數據庫,在B端如金融、汽車、工業等場景以及C端的影視、遊戲、直播等領域將有更大的發展空間。

另外,OpenAI於今年3月發布了多模態預訓練大模型GPT-4,ChatGPT的功能有了進一步提升:擁有識圖功能;擴大文字輸入限制至2.5萬字;對話內容准確性提高;能生成有風格變化的創意文本等。多模態功能將使數字人的交互、決策建議更爲真實有效。

 人人都能實現“數字永生” 

ChatGPT發布後,大量AI工具順勢而生,在一些AIGC的門戶網站上甚至收錄了海內外上千款AI應用。包括搜索引擎、文本寫作、聊天機器人、語音合成、音樂制作、繪畫生成、圖像化身、圖像合成、3D生成、視頻技術、數字虛擬人、遊戲應用、無代碼創作等40個細分領域。幾乎人人都能創建符合自己需求的數字人。

圖源:AIGC中文工具導航截圖

得益於這些AI工具強大的內容生成能力,現在網上也出現了不少“整活”嘗試。

前陣子AI在B站上掀起一陣華語樂壇的“賽博文藝復興”熱潮,不少UP主利用音樂大模型軟件,通過內容編碼器提取源音頻語音特徵,進行AI翻唱制作,讓歌手“唱”起來。與B站“鬼畜區”的人力調音不同,AI翻唱的效果非常真實自然,實際一聽幾乎難以分辨出是真人還是AI的聲音,甚至還能看到視頻中有不少彈幕討論起AI唱功好不好……

圖源:B站截圖

另一方面,也有人在嘗試證明AI“技術向善”。UP主吳伍六發布了一則名爲“用AI工具生成我奶奶的虛擬數字人”的視頻,他嘗試用AI+照片、音頻來生成已故奶奶的數字人,並與之進行虛擬對話。

前兩年韓國 MBC 電視台在出品大型 VR 紀錄片《見到你了》中,利用VR技術復活了7歲小女孩。

圖源:網絡

通過AI語音合成技術,提取小女孩生前影像音頻。同時找來5個同齡的孩子錄制上百條音頻作爲補充,最終復原成功小女孩的聲音。再結合3D建模,動作捕捉等技術抓取三維坐標數據,初步還原小女孩外形。相關閱讀:《VR 掃墓,數字永生,技術正在重新定義“生命”》

在現實中不可能做到的“復活”和“永生”,卻能通過技術得以實現,這類視頻引發了網友們對AI、生命、侵權、感情、寄托、人性和倫理道德的思考和討論,展現不同人對數字生命的理解。

 AI數字人在直播領域悄然生長 

在元宇宙中數字人已經是有着較爲成熟體系的領域,從技術到實際落地再到商業化,如今虛擬偶像、虛擬演唱會等垂直場景大行其道,而數字人直播已不是新鮮事。

圖源:IDC

在數字人商業化的道路中,無論是主打陪伴的娛樂型數字人還是以電商帶貨爲主的功能服務型數字人,AI數字人在直播中的應用率正逐漸提高,然而現階段的數字人直播,絕大多數情況下,包括外形設計、配音、互動等都仍需要人類進行幹預,AI只能實現一些簡單的交互。 在海外已有基於ChatGPT+VRM(3D模型)+VOICEVOX(文本轉語音軟件)創建聊天型人工智能的案例。例如OshaberiAI,這是一款允許用戶創建養成型角色並與之聊天的應用程序,通過設計對ChatGPT的提示(指令),爲數字人設定各種個性和語氣,與用戶進行簡單的聊天交互。

圖源:推特

目前該應用已上线AppStore,此前該开發者也在AR+數字人導航方面做了一些嘗試,推出了“ARCharaNavi”,用戶在應用中設定好目的地之後,數字人會根據選擇好的路线在屏幕中的路线前方帶領用戶前行。

而AI數字人的強大勝在可控性高,模式可復制,能7×24小時保持在线,在直播領域成了不少電商品牌的“新歡”。

中國互聯網絡信息中心日前發布的第51次《中國互聯網絡發展狀況統計報告》顯示,截至2022年12月,中國網民規模達10.67億,短視頻用戶規模達10.12億,短視頻用戶滲透率高達94.8%,而網絡直播用戶規模達7.51億。

有了龐大的直播受衆,投身於電商直播的AI數字人表現如何?成本低是品牌方選用數字人進行直播的一大因素,某品牌直播間售價和數字人服務定價,粗略計算後日均花費大約在600元左右,相比於聘請真人主播,能大幅減少支出成本。

目前在電商直播領域,AI數字人通常在夜間至凌晨直播,彌補真人主播休息期間的空缺,盡可能獲取更多闲時流量。現階段用戶可以通過關鍵詞觸發與數字人關於商品的交互,要讓AI數字人執行更細致的指令和互動還有一定難度。

圖源:抖音網頁版截圖

而在短視頻平台,已有不少AI數字人嘗新开設全天無休的直播間,實際上這類重復相似對話內容的直播間熱度並不高,如果有明星IP加入,則會帶來更顯著的引流效果。例如樂華七子的黃新淳,基於他本人的形象設計了數字人分身,結合AI算法來控制數字人的動作和表情,還能正常與粉絲進行互動。

AI數字人在視覺效果和語音上越發真實,也就意味着人們將更加難以辨別真人與“數字人”,且絕大部分人是第一次接觸AIGC內容,爲了避免更多的AI內容對觀衆造成誤解,不少視頻平台發布了相關平台規範。

抖音APP官方公衆號於近期發布《抖音關於人工智能生成內容的平台規範暨行業倡議》一文,指出“各生成式人工智能技術的提供者,均應對生成內容進行顯著標識,以便公衆判斷。同時使用統一的人工智能生成內容數據標准或元數據標准,便於其他內容平台進行識別。”

圖源:抖音APP官方公衆號

就連海外知名插畫平台Fanbox的運營商PixivFANBOX,也宣布禁止上傳和銷售使用Midjourney 、Stable Diffusion等AI藝術工具生成的插圖,將對發布由AI創作作品的账號採取措施,如發出警告、限制可見範圍、封禁账號等。未來將會有更多平台自發加入規範AIGC內容的陣營中。

AI數字人在直播領域,尤其是電商板塊的落地進程加快,其變現能力強、操作門檻低(不少平台推出無代碼方案)、降本增效顯著等優勢迎合了品牌方對數字化電商直播的需求。同時,部分頭部電商直播MCN也能憑借自身在IP運營管理、平台流量資源、品牌方資源的積累,嘗試從真人直播轉向數字人直播,提高闲時階段的收益。現階段的AI數字人仍有非常大的發展空間。

 結語 

在元宇宙盛行的時期,數字人還只是人們眼中的“流量明星”,背後又牽扯到高成本的動捕和中之人運營,普通人幾乎難以企及。雖然現階段的AI數字人仍然未達到能跟真人“搶飯碗”的能力,但成長迅速的AI正在加速數字人走向大衆的進程,而ChatGPT則是AI數字人最佳的接入口之一,爲數字人的人機交互功能帶來更多落地應用機會。

       原文標題 : AIGC重塑數字人:落地、變革、永生



標題:AIGC重塑數字人:落地、變革、永生

地址:https://www.utechfun.com/post/213918.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡