誰在“操控”虛擬人？

2023-10-16 18:40:09 編輯： robot

導讀圖片｜動漫《火影忍者》截圖 ©自象限原創作者｜程心編輯｜周遊大模型的風，吹動虛擬數字人廠商野蠻生長（以下統稱虛擬人）。《虛擬數字人深度產業報告》預計，到2030年我國虛擬數字人整體市場規模將...

圖片｜動漫《火影忍者》截圖

©自象限原創

作者｜程心

編輯｜周遊

大模型的風，吹動虛擬數字人廠商野蠻生長（以下統稱虛擬人）。

《虛擬數字人深度產業報告》預計，到2030年我國虛擬數字人整體市場規模將達到2700億元，其中，“服務型虛擬人”總規模也將超過950億元。

如同禿鷹盯上腐肉，嗅到萬億商機的各方勢力，都欲分一杯羹，這也直接導致了目前的虛擬人玩家格局陷入了“混战”狀態。

「自象限」根據各方數據不完全統計，目前國內虛擬數字人核心廠商約有6000家。而按天眼查的數據顯示，相關廠商數量甚至超過6萬家。

同時，隨着大模型(Large Model)的興起，虛擬人的產業格局也在發生深刻變化。

比如，虛擬人正在經歷從制作流程降本到技術突破的關鍵階段，從大語言模型到多模態能力，讓虛擬人從展示突破到了實時互動，這意味着未來虛擬人可能只需要一個實時渲染的外觀，就能擁有十分逼真的溝通能力。技術門檻的降低，也會讓更多參與方加入到這個开拓中的市場。而狂奔半年後，百億個虛擬人也逐漸滲透進各行各業，並逐步進入商業化階段。

也就是說，在廠商“混战”的表面下，隱藏的不僅是巨大的商業利益，更是復雜的技術博弈。而牽動着虛擬人“木偶引线”的另一頭，操控者們的世界也在發生翻天覆地的變化。

千億市場，廠商“混战”

如果說元宇宙時期的虛擬人已經是一把大火，那大模型就相當於在這之上又烹上了一勺油。一瞬間，鋪天蓋地的數字人廠商湧來，將本就復雜的行業攪得愈發渾濁。

這其中，既包括從元宇宙時期就一直堅持虛擬數字人的廠商，也有依靠全棧技術優勢輕松邁出第一步的大廠，更不乏聞風而來的換道廠商。

「自象限」初步了統計核心廠商的類型後發現，這些廠商大致可以分爲四類：

▲圖爲自象限原創，轉載請注明出處

第一類是互聯網大廠，如騰訊、百度、阿裏、京東、網易等。這裏面其實也分兩類，一類是騰訊、百度爲代表，他們業務龐大，在面向To B的解決方案上，比如金融、文旅、汽車等場景，需要一個數字人形象來符合新的交互方式。對於這些企業，數字人只是業務的一個補充。另一類則是網易爲代表的，具有技術積累的企業，由於網易在遊戲建模、AI捏臉等方面豐富的探索和技術積累，讓他們需要通過虛擬人將這些沉澱的資源轉化。

第二類是原生廠商。這是較早布局數字人的一批廠商，如即構科技、魔琺科技、硅基智能、風平智能、數字栩生、相芯科技等。這類廠商或屬於上一波元宇宙創業的“遺珠”，或屬於市場早期以電商直播帶貨、本地生活直播等場景切入數字人場景的公司，得益於AIGC技術，其中的一些公司完成了從2D數字人到3D數字人的升級。

第三類是換道廠商。基於原有技術延伸入局數字人賽道，如：商湯、華爲、科大訊飛、快手、360、美圖、蔚領時代、元境科技、新壹科技等。這類廠商在發展過程中積累了一些涉及數字人的技術。譬如商湯的視覺識別技術、科大訊飛的語言識別技術、蔚領時代的遊戲渲染技術等等，以這些技術爲突破口再結合大模型的發展，完成了賽道的轉換。

第四類是跨界廠商。他們因爲自身業務場景需求而下探數字人技術，如萬興科技、藍色光標、謙尋、高途、中公教育等。這類廠商的特點是其原本業務與數字人並無太大交集，如萬興科技主營業務是提供文圖、剪輯類的基礎工具，衍生出爲客戶提供數字人工具；藍色光標的主要業務爲廣告業務，通過數字人可以更好的完成客戶的需求；而謙尋則是一家MCN公司。但隨着應用和場景的拓展，數字人成爲了其新的發力方向，萬興科技借數字人進一步开拓了海外直播、營銷業務，謙尋借由數字人找尋到了新一輪直播帶貨流量、成交額增長動力。

源於“出身”的不同，不同廠商的商業模式和目標也完全不同。

大廠的虛擬人多爲服務自身核心战略而生，比如阿裏、京東的虛擬人多被應用在電商領域；騰訊將移動互聯網時代積累下來的RTC（實時通信技術）應用在虛擬人交互中，打造了智影制作平台；百度希壤更偏向於表演型虛擬人，爲不同企業提供定制化代言人；而網易則將虛擬人應用在遊戲、教育等多個自身業務中。總的來說，互聯網大廠並沒有急於將虛擬人獨立對外商業化，而是受自身技術的積累和場景需求催生。

核心對外提供服務的主要是原生的數字人廠商和換道廠商，從上個風口到如今，這類廠商已經積累了數字人的技術經驗，對於底層技術、細節把控和場景的探索都有着更爲體系化的認知。根據技術路线的不同，原生廠商又被分爲2D廠商和3D廠商，2D廠商更傾向於虛擬人與場景的結合，而3D廠商則處於技術迭代的狀態。

“2D虛擬人制作有兩種方式，一種是請真人錄制，然後幫其定制形象。一種是從用戶提供的視頻中提取形象，再用到各種場景中。但是2D數字人沒辦法做到3D那樣轉身、跳舞、做各種動作。”即構科技對二者的制作差異進行了詳細解釋。

但由於2D虛擬人的制作成本低，帶動了整個虛擬人市場“飛入尋常百姓家”，填補了市場由於價格攔路而不能落地的需求鴻溝。「自象限」了解到，目前原廠廠商是大公司和品牌側傾向的選擇，通過行業KA客戶打造標杆案例，比如銀行、大型消費品品牌（健力寶）、美妝品牌（HR赫蓮娜）等等。

換道廠商和跨界廠商有異曲同工之筆，如商湯、美圖等換道廠商，在上個階段積累了CV、圖像識別等技術，被應用在了虛擬人的制作中，而像藍標、謙尋等公司，源於自身的需求出發，爲了避免高昂的採購成本，也選擇自研虛擬人，技術不夠硬核但有固定的客戶群，商業化冷啓動相對迅速。

產品成熟，重在交付

今年8月、9月开始，虛擬人廠商產品开始加速迭代。據不完全統計，兩個月內至少有10家廠商發布了新的虛擬人產品。

產品的高度迭代意味着虛擬人正在飛快得適應市場需求，而這也意味着虛擬人第一階段的賽點已經走入關鍵階段。

從類型來看，虛擬人廠商分爲兩類，一類直接交付虛擬人產品，包括通用虛擬人產品、行業垂直場景的虛擬人產品，比如電商、零售、營銷、直播等，客戶即拿即用，或標准化或定制化；另一類則提供虛擬人制作平台，客戶通過使用平台提供的工具，自主生產虛擬人。

相比之下，產品交付類型更適合企業探索虛擬人初期，幾乎不需要技術團隊配合，門檻更低，也是目前較多企業選擇的方式。

針對這類產品形式，虛擬人廠商也提供了多樣的購买方案。如汽車試駕一樣，品牌在購买虛擬人之前，可以先可進行Demo的試用，真實感受虛擬人的表情、動作、交互等等。除此之外，品牌在購买前還可以進行方案咨詢，廠商會根據客戶情況，制定具體的虛擬人傳播方案，並有多種不同風格的虛擬人可以選擇。

以即構虛擬人Avatar爲例，企業可選擇擬人形象和Q版形象，並可以在线直接體驗給虛擬人換裝、捏臉，並通過AI完成了表情驅動、聲音驅動、文本驅動、肢體驅動等全方位的驅動方式。

▲圖源：即構官網截圖

提供制作平台的廠商產品則更加復雜，如魔琺科技的三款產品分別針對了不同場景進行，包括虛擬視頻、虛擬人直播和獨立的虛擬人服務，並且在後端打造了端到端的寫實3D虛擬人工業化產线，包括從技術到調試到運營的“星雲平台”，讓虛擬人能夠和大模型結合，長出“腦子”，真正實現3D交互。

▲圖源：魔琺科技發布會

今年8月，魔琺科技升級了有言AIGC生成平台、有光直播帶貨平台和有靈虛擬人制作平台，爲企業提供系列生成工具，企業根據自身需求，能夠更加靈活的調整虛擬人的細節、結構和適配的使用場景。

相比之下，商湯既能夠直接交付虛擬人產品，也打造了如影虛擬人制作平台，基於在視覺、語音領域積累的3萬個算法模型，打造了集智能化生成、智能化驅動、智能化交互的數字人平台。在商湯智能化引擎驅動下，虛擬人能快速識別、反應，與用戶建立起對話關系。並且，事後，虛擬人也不會“失憶”，繼續學習迭代。

這也說明了，當下廠商不僅是商業模式上的競爭，更是技術先進性的比拼。

技術”三級跳“

從整個虛擬人的技術發展進程來說，大模型帶來最核心的改變，是推動着虛擬人從第一階段看起來“像人”，到能夠與人實時互動。

▲圖爲自象限原創，轉載請注明出處

第一階段，虛擬人廠商比拼的是“誰看起來更像人”？虛擬人廠商的核心技術多在傳統的CG（建模）技術、驅動技術、渲染引擎等等，所以虛擬代言人爲代表的表演型虛擬人成爲了核心交付產品。

但由於技術的不成熟導致了虛擬人制作成本高企，「自象限」從行業內人士了解到，2022年，某大廠提供的訂制虛擬人價格高達10萬，這讓虛擬人根本無法規模化落地。

大模型來了之後，一方面讓虛擬人制作成本進行了大幅度降低；另一方面，AI技術加速了虛擬人的交互功能，讓虛擬人交互起來更像人。

某虛擬人制作廠商曾吐槽：“以前6888元一個，賣一個賠一個”，通過智能渲染、智能驅動，流程自動化制作等能力，讓虛擬人的制作成本有了30%-50%的縮減，市面上甚至冒出了“99元、299元一個的虛擬人”。

更重要的是，大模型技術加速了虛擬人對語言語義的理解能力，讓虛擬人能夠從簡單的檢索生成，到語言文字AI驅動，更快速的對人的需求進行回復，甚至做到“秒回”，同時模型也驅動了渲染技術、擬真技術、超寫實技術的進化。

舉個具體的例子：交互的核心並不只是動作反饋，更是內容的生成和語音的交流，故而，AIGC技術和語音生成技術成爲了當下技術發展的核心。

▲圖源：網絡

大模型讓虛擬人“長了腦子”，有了思考和推理能力，AIGC技術讓虛擬人能夠有“想法”，TTS（Text To Speech 文本轉語音技術）技術則讓虛擬人能夠“表達”。

幾天前，在GPT-4V版本更新，TTS實現了進步，文本驅動語音有了語氣和口吻，在停頓、重音和自然交互程度上有了極大的提升。不僅可以模仿不同的口吻，甚至設定“渣女”時還學會了“夾子音”。

有行業專家推測：TTS技術端到端成熟後，對行業格局的改變會很大。因爲虛擬人真的能夠實時交互後，落到產業裏才能產生實際價值。

從看起來像人，到實時互動，大模型推動着虛擬人完成二級階躍，但這也只是一個新的开始。從元宇宙到大模型時代，虛擬人真正備受關注的內在原因在於，他將有可能是下一個虛擬時代的“入口”，背後連接着新的虛擬世界，入口屬性讓其變的既性感又危險。

國外最早布局虛擬人的微軟小冰CEO李笛則認爲：虛擬人未來是混合模型。

本質上，這兩種觀點的內核是一致的，只不過李笛的假設更爲具體。下一階段，將進入“虛擬人＋”的階段，虛擬人＋RPA在企業內部打造數字員工；虛擬人＋AI Agent，在C端打造陪伴型機器人；虛擬人＋AR/VR，在3D空間打造可見的遊戲NPC；虛擬人＋具身智能，讓人型機器人有了靈魂。