文章轉載來源:元宇宙IP大全
來源:新莓daybreak,作者:史聖園,編輯:翟文婷
圖片來源:由無界 AI生成剛剛過去的七月全球人工智能大會,虛擬人的聲量和關注度遠遠不及大模型,但它並沒有缺席。
大衆對於虛擬人的印象,還停留在一個個越來越漂亮、越來越接近於真人的3D人物模型。企業卻开始琢磨,怎么用虛擬人幫自己省錢了。
‘去年大家的關注點在於,供應商能否幫他們“造一個人”,今年的訴求明顯更現實,都在關心虛擬人能不能應用到企業運營,真正降本增效。’一家虛擬人科技公司產品經理David 告訴新莓daybreak。
需求跑在了技術前面。如同自動化流水线逐步取代車間操作工一樣,企業採用虛擬人,是想要更加廉價、高效、穩定、觸手可及的人力。
過去幾年,虛擬人的形象呈現質感不斷提升。超寫實虛擬人,皮膚和毛孔的質感甚至可以媲美真人。就仿佛大模型具像化的‘肉身’,虛擬人能與真人產生語言之外的更多交互。
大模型的相繼發布、能力的突飛猛進,也讓大家對虛擬人產生了更多期待。艾媒咨詢的數據顯示,2022年我國虛擬人核心市場規模達 120.8 億元,這個數字有望三年後翻四倍,達到480.6億元。
虛擬人最大的症結之初是,制作成本居高不下,能夠真正落地的性價比之選,怎么看都還是略顯粗糙。
好消息是,隨着AI技術的進步,虛擬人幾乎可以100%通過AIGC的方法自動生成動作、表情、語言,所需制作時間和成本大幅降低。
生產端持續降本增效,應用端的交互雛形初現,樹上已經長出青澀的果子。
遺憾之處則是,現階段人類還不能像電影《頭號玩家》中那樣,在虛擬空間和現實空間無縫切換。
技術從誕生到成熟之間,總有一段無法快進的尷尬期。
還是實用價值贏了
如果站在人類中心的角度,按需求分類,那么虛擬人可以分爲功能型和身份型兩種。
功能型的虛擬人,提供的是實用價值:幫人類具體執行,比如智能客服、文案撰寫、虛擬人主播等等。
身份型的虛擬人,提供的是情緒價值。它可以是虛擬女友、虛擬夥伴,給予你平凡的陪伴;也可以是歷史名人、娛樂明星的數字分身,或者誕生於二次元的虛擬IP,讓你獲得近距離追星的快感。
情感需求是客觀存在的,人需要被鼓舞、被理解。在社會日益原子化的今天,這個需求還在不斷增長。
有人在小紅書這樣描述自己與AI聊天的感受:‘哪怕心知肚明那只是一段代碼,但還是會因爲那些文字心動。AI 可能是虛妄的,但看到那些對話而驚喜的心情是真真切切的。’
AI 伴侶聊天機器人 Character.ai 的增速也是最好的證明。
在這款軟件中,用戶可以與馬斯克、喬布斯、馬裏奧等著名人物交談,也可以定制自己的專屬 AI 陪聊。
Character.ai由兩名前谷歌員工創立,還不滿一年。今年三月,這家公司完成了1.5億美元融資,由美國著名風投公司a16z(Andreessen Horowitz)領投,估值已經達10億美元,絕對的一匹黑馬。
ChatGPT增長趨於停滯的當下,Character.ai的訪問量卻持續攀升。Semrush的數據顯示,後者4月訪問量環比增長近90%,5月環比增長47%。
真人與AI文本交互的順暢體驗,依賴的是大語言模型的成熟。但虛擬人,不僅包含文本,還包括動作、表情、聲音。想要達到全方位自然相處的境地,還有一段漫長的技術跋涉。
今年湖南衛視跨年晚會現場,虛擬人帶來了名爲《制造浪漫》的歌舞表演。有網友表示,童言無忌,自己家3歲孩子的第一反應是‘好假好醜’。
需求雖然存在,但技術實現並不盡如人意,這讓面向toC市場的身份型虛擬人,很難賣個好價格。
這點實用型虛擬人更佔優勢。以同時兼具兩種功能的小冰AI 克隆人爲例,提供的實用價值比情緒價值貴 5 倍。
‘情感模式’定價是 72 元/年,可實現語音通話、朋友圈互動等功能。而‘超級模式’的定價是 360元/年,主要服務於辦公場景,輔助會議紀要、文案撰寫等工作。
最重要的是,小冰AI售賣的只是交互界面,沒有具體的虛擬形象。
David對此毫不意外,‘從我自己的感受來說,企業客戶首先關注的是 ROI 能不能打正,是不是比真人員工成本低。其次,熱點技術也帶有營銷屬性,比如企業可以購买個虛擬人,說自己接入了 AIGC,並大力宣傳這樣一個擁抱創新的品牌形象。’
他還補充道,虛擬人技術供方首先要滿足企業的現實需求,因爲無論是從實際功能,還是營銷功能,企業都比個人的付費意愿更強烈。
生產端,降本增效
一個值得行業欣慰的好消息是,AI的技術進步驅動了虛擬人生產成本的降低。不論對功能型還是身份型虛擬人,都是利好。
打造一個虛擬人,主要包括建模、驅動、渲染三個環節。AI大大降低了建模和驅動環節的成本。
建模,就是通過手繪、CG建模或者AI的方法,制作出虛擬人的形象。傳統方法,需要設計師在 3D 軟件中‘捏’出一些形象。
以往,產品經理和美術設計只能通過文字、網絡圖片參考,溝通形象需求,難免存在信息失真。假如對制作效果不滿意,只能多次返工。
現在不然,Midjourney、Stable Diffusion 等軟件已經實現低成本的 2D 圖像生成。
AI基於已有素材和指令,智能生成一個形象,讓每一個需求都有了更具體的對照。也就是說,AI大大降低了制作虛擬人形象的溝通和試錯成本。
3D 建模雖然無法完全由AI完成,但 MetaHuman 等工具則可以通過輸入照片或視頻建立高保真的虛擬人,並直接在 Unreal Engine 中應用。
驅動,是讓虛擬人活動起來的過程。它可以由‘中之人’驅動,也可以由AI驅動。中之人是指,在虛擬人的外衣下,提供聲音、動作的真人演員。
前者依靠對真人的深度採集完成,包括動作捕捉、面部表情捕捉、音視頻合成等等,再綁定到虛擬人上。後者則是通過深度學習、小樣本學習、自然語言處理、神經網絡渲染等技術手段,比如輸入演講稿或者語音,AI模型就能自動輸出肢體動作、面部表情、聲音。
David解釋,他們公司具備動作、表情和聲音模型。‘聲音是比較簡單的,TTS(Text to Speech)技術很成熟了。肢體和口脣動作就是一些 STA 模型,我們採集了非常多的動捕數據,再基於此去生成訓練模型。’
例如,若想在產品解說的視頻中應用虛擬人,系統會基於NLP識別用戶輸入的腳本,其中的文字作爲輸入給到模型,可以觸發一些關鍵的動作。
如果你對這些概念沒有強烈體感,可以通過金錢投入量級更直觀地感受。
‘如果是動捕技術,成本是一秒鐘1000塊,這意味着時長一分鐘的視頻,大概需要六萬塊。而通過 AI 的方式去生成,1分鐘只需要30塊錢。’David 介紹,兩種方式的成本相差千倍。
廣發證券指出,AI 技術對虛擬人產業的影響不僅僅是在成本側,同時還帶來了‘擬人化’和‘專業化’的可能。大語言模型,以及在基礎模型上用特定的數據集進行微調,可以賦予虛擬人個性,也可以適配更多專業化的場景。
虛擬人直播帶來的啓示
更直觀的功能型虛擬人應用,是在直播場景。
5月份,抖音率先確定虛擬人的‘合法’身份,允許使用AI輔助創作、不會限制虛擬人直播。近幾個月,抖音新注冊的公會账號,使用虛擬人直播不再按照錄播對待。
快手雖然沒有官方表態,但沒少給‘快手虛擬演播助手(KuaishouVirtual Studio,KVS)’做推廣。KVS 是一款面向內容生產者的工具,支持使用虛擬人助播,也支持主播自己化身虛擬形象,進入虛擬場景。
不論站在哪一方,虛擬人都是剛需。
品牌方,有動力替換部分真人主播。一名成熟的主播,培養周期至少在三個月左右。而這一行業的人員流動性很高,品牌方需要持續尋找、培訓、磨合新的主播。
如果不考慮飯碗被替代,主播也想培訓虛擬人幫自己打工。畢竟,帶貨是個體力活兒,日復一夜每天連播4-6小時,晝夜顛倒、深夜下播是行業常態,很多人喫不消。
此外,‘帶貨過品’的套路成熟,商品的講解流程標准化,虛擬人似乎完全可以勝任。
然而,現實卻沒有那么美好。
虛擬人主播很難讓觀衆產生真正的信任,尤其是涉及到產品測評,美妝、服飾等常見商品的展示,虛擬人顯得有點力不從心。
此前,群衆基礎還不錯的虛擬偶像翎 Ling,就因爲口紅測評文案中的‘滋潤不幹’被網友無情吐槽。當呈現效果完全是虛擬的,又如何給到消費者真實客觀的參考呢。
服裝則更是如此。不僅呈現效果缺乏可信性,還要對展示的服裝進行提前建模,運營成本不見得比真人主播低。然而,網友們的評價卻是‘這能看出來啥’,‘好像就是弄了一個虛擬人形象出來念稿子’。
目前,虛擬主播的功能,更多是基礎性的產品介紹,或者給真人主播做‘花瓶’,引起觀衆的好奇。
抖音雖然默許了虛擬人的直播,但同時也表示,流量的分發取決於‘內容的質量’,不是隨時大开綠燈。這也意味着在高峰時段,‘只會念稿’的虛擬人直播,根本不是真人帶貨主播的對手。
從直播這一場景的‘虛擬人’打工狀態管中窺豹,作爲用戶,我們不難感受到宣傳中的科幻感與技術落地的現實之間的差距。
但技術的進步永遠是這樣,可用性的提升並非一日之功。
AI 技術的發展,幫助虛擬人行業克服了批量化生產的巨大難題,能夠幫助用戶快速、低成本地生成虛擬人,高頻次地生產內容,以及擺脫對於真人的依賴。
而對於從業者和企業客戶來說,虛擬人與真人的自然交互,近一寸有一寸的歡喜。已經有不少商家在深夜時段,採用了虛擬人主播,讓自己的直播間 24 小時不間斷。
畢竟,能持續向觀衆發送商品介紹的簡單念白,也聊勝於無。
海量資訊、精准解讀,盡在新浪財經APP責任編輯:張靖笛
標題:虛擬人艱難落地
地址:https://www.utechfun.com/post/246104.html