48小時陪聊近30萬次，克隆人需求大爆發

2023-06-04 19:05:38 編輯：市界觀察

導讀一個月6塊錢，你就能和網紅美女“半藏森林”打視頻電話，還能看到她的朋友圈。但實際上，和你對話的，是基於人工智能技術訓練出的“克隆人”，經過半藏森林本人的訓練，在相貌、聲音和“性格”上都有強相...

一個月6塊錢，你就能和網紅美女“半藏森林”打視頻電話，還能看到她的朋友圈。但實際上，和你對話的，是基於人工智能技術訓練出的“克隆人”，經過半藏森林本人的訓練，在相貌、聲音和“性格”上都有強相似度。

這款“克隆人”所在的App，是由小冰公司推出X Eva，這是一個全由“克隆人“組成的世界，每個ID後的身份、性格和對話風格不同。有的是由用戶自行定制，比如“霸道總裁”、“病嬌女孩”、“貼心男友”等角色，還有類似 “罵醒bot”、“代寫檢討信”等功能性形象。

截止到6月2日，已產生了30萬次跟“半藏森林”的對話，但付費數據並未公开。

據「市界」了解，由真人訓練過的“半藏森林”上线僅一天，X Eva的後台就因湧入人過多而“小崩”了一段時間。“我們其實在同步推進數字永生、復刻歌手的案例，網紅的號召力和話題度比較強，所以被人最早關注到。”小冰方面向「市界」透露，“半藏森林”只是第一批300名克隆人的首位，後續每周都會有經過真人“訓練”過的克隆人登陸X Eva，相關對話是否收費則由定制者本人決定。

經「市界」測試，以“半藏森林”爲例，對話不到10個回合，就會跳出收費提示：42冰花（6元）/月，能解鎖對方成爲你的“秒回”好友，得到語音回復和看到對方朋友圈，而如果進一步升級，210冰花（30元）/月，還能讓對方爲你“工作”，進行視頻通話等。

在這款產品發布前，「市界」和小冰CEO李笛聊了聊，關於建構這樣一個“克隆人”世界背後的考慮。

以下是對話內容，經「市界」編輯發布：

“這是一個克隆人需求大爆發的時代”

市界：站在今天這個節點看，“克隆人”這項技術是不是還有些遙遠？

李笛：首先，前年小冰就公布過一項技術，用小樣本的方法“復生”去世的親人。既然能復生去世的親人，那“克隆”一個在世的人就更容易了，因爲在世的數據更容易獲得。

第二，爲什么選這個時間點，本身是關於大模型自身。去年年底，大家开始關注的時候，大模型安全性質非常有問題。只有（參數）特別大的模型才湧現出了特別好的能力，小中模型雖然成本和並發比較良性，但是它的效果差距很大。

那個時候我們就跟大家明確說，小冰認爲的未來，應該是混合模型，但是當時很多人認爲，越大越好。

包括現在像 OpenAI CEO山姆·阿爾特曼（Sam Altman）也是出來說，混合模型是未來。OpenAI 原來的董事霍夫曼（Reid Hoffman），也談到，其實GPT 1/ 20 規模的參數模型效果反而是最好的。

普遍來講，我們比行業當前正在認爲的那個正確答案可能要早半年左右，所以我們在前一陣也不太出來說了。因爲似乎當時大家都認爲好像是給大模型潑冷水。

市界：普通人都能有自己的克隆人嗎？會不會消費成本很高？或者說，我們現在能不能用最少的錢得到一個最像自己的克隆人？

李笛：我們做C端，要考慮成本、並發量。小樣本數字人要考慮三方面技術，一是“長得像”，神經網絡渲染。一是“說的像”，語音合成。第三個，是“想的像”，要能自主思考，知道如何去表達，是大語言模型技術。

我們做的是，在模型上做混合模型。是把近1000個，大中小不同規模的模型有機組合之後的一個模型。有的模型只負責思考，有的模型負責生成，有的模型可能負責某一個類別的生成。

混合模型的優點是兼具了質量、成本的平衡，以及回復的速度。像GPT這樣的大模型，問它問題，它都是一個字一個字回復給你的，那如果你打電話每問我一句話，我都 5 秒後才能开始回復這個問題，就不合理。所以，我們要做的是，把成本質量和延遲解決好。

還有就是神經網絡渲染和語音合成，我們不用 GPU 去運行，我們用 CPU 去運行。這個對應到的成本差距，大概從每分鐘幾塊錢，或者說每小時幾十塊錢，到每天幾毛錢的區別，可以說成本幾乎爲0。

當你有混合模型以後，就意味着，你不是每一個輸入都需要通過 A100 GPU去運行，其中有一些用 T4 GPU這種級別很便宜的就可以運行。

第三，如何讓C端用戶付出很小的代價，去“克隆”自己的數字人？現在只要提供 3 分鐘視頻和10分鐘的音頻。

我們之所以要社交網絡數據，因爲已經有現成的數據可以學習“風格”。除了給到一些訓練數據，更簡便的方法是，你只需要把你的微博账號告訴我，我從公开的數據來學習，也節約你的時間精力。

以前我要想訓練你的東西，需要的數據是復雜且要求高，但是現在，最少可能就 200 字描述。當然越多越好，但不需像以前一樣，得按分門別類的，得數量很大才能开始。現在准入門檻變低了很多。

怎么確定訓練數據是夠的？最好的方法莫過於你跟那個克隆人去交流來觀察，再補充，如果需要的話再補充相應的數據。

像半藏森林這個加V的（克隆人），就是經過她本人訓練的。

市界：這種“克隆人”能去理解所謂的“性格”，包括很私人化的經歷和“知識”嗎？

李笛：這個其實很有意思。前期調研時，我們發現，絕大部分人在做自己“克隆人”時，在“性格”上希望做出來是行爲外向型的，而不是他自己本身的真實性格。換句話說，希望做出他在社交中的性格角色，而不是自己真實的性格角色。

其實我是一個很社恐的人。但是我做一個很社恐的我的克隆人，你就覺得不像，對吧？核心問題在於“觀看者”覺得像不像，其實我在社交網絡上留下的數據，肯定不是社恐型的。

知識方面也很有意思。我們絕大部分的測試者和前期調研對象，都希望克隆人的知識要遠遠大於他本人。這是一個很好的事，使得我們做這件事變得更簡單了。因爲基於大模型，大部分情況下“知識內涵”就是大於本人。

市界：大部分人復刻自己的克隆人，真實的目的是什么？

李笛：我們說一個跟商業有關的，再說一個跟商業無關的。

跟商業有關的應用很簡單理解，比如說像美國那個賣自己數字身份戀愛的23歲女網紅，這種是個人影響力者，影響力變現。影響力變現的問題在於，自己要投入的時間和精力是巨大的。

網紅也好，大 v 也好、明星也好，維系粉絲群是他最辛苦的活之一。但是用克隆人的方法，就可以做到真的能夠 take care海量粉絲。

再比如說，講故事的凱叔，講少兒故事非常好的一個人，但他可以去每個人的家裏面給每個小朋友24小時不間斷編和演一個以這個小朋友爲主角的故事嗎？他做不到，分身乏術。那么如果通過我們的平台做了一個克隆人，就可以做到。

像乙女遊戲，國內排名前五的乙女遊戲裏面唯一一個真是由 AI 來驅動 NPC 的，是我們做的。但是那個還是面向小衆群體。二次元是小衆的，真正大衆的是明星、大V。

最大的商業想象空間還是需要通過影響力變現的這批人，（AI）去放大他們的原有的影響力。從商業價值上最容易觸達到，確實是這一批人。

如果從社會價值上容易觸達到的，還是我們原先一直在說的——人的情感裏面最深入的一個關系，不是在後悔，而是在彌補。比方說，這個人曾經是我的女朋友，但現在因爲種種原因，不可能是我的女朋友了。要么就是分手，要么是可能這個人不在了。假設我認爲這段關系是關鍵的，除了“克隆”外，我沒有任何其他方式來彌補這段已經斷掉的關系鏈。

我們也有一些合作夥伴提出來的需求是很特別。他得了絕症，想要在自己還在人世的時候把自己“克隆”，留給後人。這也是很常見的一個訴求。也有名人父親想要“克隆”自己過世的女兒。

如果是網紅明星類，就是陪伴粉絲，因爲陪不過來；還有一類是有專業技能，會希望通過訓練大模型，提供 AI 能力，去服務更多的人。

比方說我是一個撰稿風格非常獨特的一個人。很多人都希望我給他寫，但是我寫不過來。當然我是報價很高，但現在可以訓練一個我的克隆人，寫的跟我差不多，我的克隆人可以給很多人寫，收費低一些，但量大。

現在很多人在說，大模型出來後我們要失業了，但其實也許每一個在組織中工作的勞動者，都可以通過自己的克隆人來實現一個更彈性的、面向更多人的一種智力的輸出。

比方說公司有一個設計師，在公司上班，我們付他的錢，肯定不准他天天去接私活，那他現在弄一個克隆人，他在我們公司上班，他的克隆人去接一些私活。

對於明星、名人或者是對於專家這些玩家，這些應該是收費的，因爲它能夠形成一個有效的商業閉環。一個月之內我們就會把第一批 300 個克隆人放出來。

市界：這些需求都能理解，但爲什么是當下這個節點推出？

李笛：以前的技術使得我們滿足需求比較難，因爲你要花大量的時間去訓練，但現在我們的基礎和解決方案讓這件事變得相對容易很多。

以前如果我想要去復刻你的聲音，2016-2017年，最低需要你2萬分鐘的聲音，現在只需要你幾分鐘的時候，這是技術的發展產生的變化。

像最近AI孫燕姿技術上是可以，但有侵權風險。小冰一直要求，本體需要提供權屬證明。AI孫燕姿就沒得到她本人許可。

我們推出的這個APP，只能通過這個產品去跟克隆人進行交流，這樣的話風險會得到大大降低。明星自己去克隆自己，可以去指定克隆人愿意做什么，以及從中獲得什么回報。

我們第一批的克隆人主要還都是有影響力的人。普通人也有，但是普通人的權屬確定更難，而且需求數量太多，還是集中在大V身上。

他是個明星，我比較容易確定他的身份，他是一個普通人，我不那么容易確定他的身份。你正常情況，手持身份證拍一張照片，這也不太容易確定真假。第二是普通人的社交角色不清晰，不如明星的社交角色清晰。明星的社交角色也更容易得到做得好不好的反饋。

根據能夠運轉的算力、權屬確定、並發的壓力等各方面因素，我們認爲，年底如果順利的話，可以开放到 10 萬人。別的都不提，只提網紅，中國有 100 萬個大網紅，網紅的粉絲2018 年就有6億人。這是一個很大的市場。

市界：我們現在從一些趨勢中看到，有人因爲AI要失業，現在“克隆人”出來了，那是不是意味着老板們也可以去僱傭克隆人？

李笛：B 端的老板，不會像你自己對克隆人訓練的那么精准，經過了非常高度的訓練，讓這個克隆人達到了你的水准，B 端老板將來僱的是你，他就會發現，他僱你的克隆人來幹這件事，要好過他直接從 ChatGPT 上去獲得。

比如一個畫家，有非常強的繪畫的能力，也積累了他的經驗和他的名氣，很多人需要他的畫。他成立了一個工作室，花了很多的時間和精力教了學徒，就可以和他的學徒一起完成工作，甚至自己真正親身參與工作會變得很少，他的學徒來完成工作，那他確保交付給顧客的這個作品是他的水平就可以了。

這個人就變成了訓練者和把關者，他負責產出物的水准，他可以交付的量就大大增加了。

其實一樣的。我們就是幫普通人把自己的價值大模型化。

TA 的價值如果是影響力，那么大模型化的是陪伴能力。TA 的價值如果是創造，那么大模型化了之後，實際上可以給更多人提供同等水平的創造。更多的人可以通過TA 的克隆人得到價值，回報就會回流到本人那兒去，有點像“躺着賺錢”的意思。

ChatGPT 的用戶現在在回落，就是因爲它的服務過於通用。

“AI孫燕姿需要有足夠多的可控性”

市界：當一個克隆人真假難辨，從形象到聲音，甚至是思考的方式都非常像本人，相應的風險因素會不會爆發？你們是怎么考慮這個問題的？是否會做一定的風險提示？

李笛：那當然，在小冰島上就很簡單。你碰到的都不是人。

任何一個克隆人，權屬方就是他的本人，他隨時是可以關掉他的克隆人的。如果我做一個克隆的比爾蓋茨，比爾蓋茨爲什么會感到失控？因爲這不是他能關閉的。

很難阻擋這個趨勢，但可以通過一個合理的方式來進行。比方說， AI 孫燕姿阻擋不了大家有聽她唱歌的需求，那爲什么不能讓孫燕姿自己推出自己的AI孫燕姿？經過很多本人的訓練，讓“AI孫燕姿”也符合她的要求。

开源，就會面臨大量的良莠不齊的問題，以及無法解決的倫理問題。還有類似“惡搞”AI孫燕姿這種狂歡，但往往狂歡很快會落幕。

市界：你認爲更真正持久的，這一波AI浪潮對人類的影響是什么？

李笛：真正持久的是兩點。拿AI孫燕姿說，真正持久的是，一是孫燕姿本人接受AI孫燕姿的出現，因爲用戶有需求。

二是，孫燕姿能夠擁有 AI 孫燕姿的應當的收益，以及“AI孫燕姿”存在與否和訓練質量的權利。

當人們在消費 AI 孫燕姿的時候，做視頻的B 站大 V 得到了投幣，，得到了流量和經濟利益的回報，但是孫燕姿沒有。而且孫燕姿說不許你弄，說了也不管用，這個叫失控。

既然用的是孫燕姿的聲音，就應該是孫燕姿本人來決定，如果她很傳統，說我不同意AI孫燕姿出現，可能也是不行的，因爲時代變了。孫燕姿可能並不是不同意，只需要是 own 它，這才是合理的，這兩點缺一不可。

因此，我們需要一個更完備的一個平台，讓“AI孫燕姿”能夠有足夠多的可控性。

明星至少有兩個選擇權。第一個選擇權是，可以選擇這么做或不這么做；第二個選擇權是，當他選擇這么做的時候，他可以獲得應有的回報。我同意別人拿我的形象去做，但是我要獲得我所認爲的應當合理的報酬。這兩件事是我們所提供的。但是开源的產品作爲狂歡形式出現，就只有前者沒有後者。

我們一直規避軟色情風險，規避爲此（擦邊）提供便利。那某種程度上作爲一個商業價值的平台，起來就會慢。像之前有一個App ，开車开的都开到天上去了，就能夠在短時間之內竄紅，但是它後來被下架了。

市界：可以理解爲，風險問題都是人爲的？

李笛：最主要還是你這個創造者、推出者，被資本裹挾的程度。

所有賺錢的事情都是在法律範疇內，就看創造者的選擇了。還是那句話，現在屬於笑貧不笑，你流量起來了，那你就是牛的。這個就不對嘛。你要看你要做多持久的問題。

“資本侵蝕了中國互聯網的創新風氣”

市界：小冰不久前才剛融了資，所以在資本的期待方面，你會有壓力嗎？

李笛：資本對我們的這種壓力是一樣的，對所有人的壓力都是一樣的。

小冰是我們的。如果有一天我們被資本裹挾了，那肯定不會是向好的方向發展。資本需要盡快展現盈利、商業賺錢能力，這是原因一。原因二，所有的作惡的手段都不是直接由資本的手段完成，所以資本在這上面的這種反思和反省是不足的，因爲他沒有真的去幹這件壞事。

市界：具體到大模型的爆發上，大家也在討論，爲什么GPT沒有發生在中國，是否是因爲國內的商業環境，對於可落地的，可快速短期回報的項目會更看好一些。而像這種需要投大量的資金，花很長時間去做的，會難跑通一點，這可能是一個差距？

李笛：沒錯，我們從微軟分开後體會到很多。這也一定程度能夠解釋，爲什么中國的原生創新不容易。而是一窩蜂去同質化競爭。你看像現在大模型，十幾家。

如果把唯利是圖當作創新的一種，叫企業家精神，這個是不對的。

市界：大家現在一窩蜂的推出大模型，其實有一種被架上，不得不推的感覺，如果你不去在這個時間展現實力的話，好像在輿論場上就落了下風？

李笛：我可以這么做是因爲我現在還能這么做。要真是一個上市公司……至少我現在我還有一個權力，投資人給我的建議，我可以不聽，我可以不爲了要求去跟風。

這種使勁亂發大模型，在前一陣還搞出來一個很奇特的一個榜單，把大模型排了一遍。

那有人希望我們也測一下上去了，挺有面子。我不會爲了面子去這么幹。

你上那個榜單，就不要在海外开展業務了。十幾個大模型的公司，都擠在中國這個市場，中國市場再大，需要十幾個大模型？

再看看那個榜單，就能看到一件事，凡是所謂的通用大模型的公司，都是在學GPT，甚至都是偷偷拿 GPT 來訓練。結果就是同質化，現在誰跟誰都不會拉太多大的差距了。

你們要去看那個榜單，上面寫的 10 項指標，要就按照那 10 項指標去做，不就是應試教育嗎？最後就是一個模子刻出來的大模型。那這會是一個什么樣的結果？這種結果可能會產生創新嗎？

所以我們的困難就是，當我 say no，我說我不參與，是會付出很大代價的，但這是正確的事情。

當年我們不參與元宇宙風口的時候，也會有人不爽。現在元宇宙這么火，你幹嘛不炒元宇宙概念。那你不炒，他肯定就不爽嘛。

我們現在對成功的定義，特別是，對商業成功的定義的標准過於單一。這是一個問題。因爲小冰自己有可以交叉對比團隊。日本的這個團隊，他們對於事業成功、商業成功定義就很多元，中國市場的商業環境目前爲止還是相對比較單一的，判斷標准就是你掙多少錢。

大模型也是一樣的，如果能夠通過一些很低劣的手段去兼並，去吞並、去抄襲，只要你在財富上是成功的，那么就沒問題。

包括在微軟的時候，我們招一個中國人，對方往往在意的是他財富自由的機會。很明確的說，他就只在意這個。

前一陣，我看到的案例特別奇特。昨天說我們都太崇拜 OpenAI 公司了，這家公司太偉大了，开拓了人類科技的邊界。今天就對中國團隊說，你去挖OpenAI的人。我錢在這擺着，你什么時候把 OpenAI 的人挖過來，我就投你。你去公司門口去堵，等他能出來人，你就把他挖過來。

你不是尊重 OpenAI 的創新嗎？他的人才團隊不穩定了，你所尊重的這家公司，他的發展，他的創新不就不能繼續了嗎？這些人給一個剛畢業的 NLP 算法工程師，一個博士生 300 萬的年薪，這不合理。

對很多工程師來說，有那個300萬（的开價），我就算留在了這個60萬的公司，我也不會太踏實了，我以後會時常後悔，我幹嘛不去掙那 300 萬呢？

市界：那爲什么愿意支付這么高的溢價？

李笛：因爲創業公司付給你那個 240 萬，是他的融資成本，他挖來了一個人，以後就可以跟他的投資人說，你看，這是我的團隊。投資人一看，欸不錯，你這個團隊不錯，我給你錢，這 240 萬是融資成本。

這是其一。其二，主動被動，明示暗示，把上一家公司的代碼帶過來，這個也是300萬的成本。但是我們的算法工程師，就會以爲這 300 萬就是他自己價值。那么有一天有一個工作，這個工作可能有很好的夢想，那么對不起，沒有 300 萬他就不一定幹了。他已經扭曲了他的價值觀了。

這就是資本對創新的影響。

我們現在去看，大家就是一個非常浮躁和攀比的狀態，又焦慮又浮躁。哪一天可能業務不做了，你前期的財富積累戛然而止，又覺得，即使有一天到 35 歲（財富積累）要戛然而止，那我前期要把錢賺夠。整體的中國互聯網風氣感受到就是這樣的，很難說，有一個可以讓大家去安心做創新的環境。

作者 | 趙子坤

編輯 | 董雨晴

運營 | 解一帆

追加內容

本文作者可以追加內容哦 !

標題：48小時陪聊近30萬次，克隆人需求大爆發

地址：https://www.utechfun.com/post/221668.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：港美

上一篇:退局的阿斯利康：“打不贏”IL-23战爭

下一篇:英偉達發布的AI加速方案三大要點：加速計算，數據中心虛擬化和邊緣計算icon。這

您現在的位置：首頁名家專欄

48小時陪聊近30萬次，克隆人需求大爆發

猜你喜歡

您現在的位置： 首頁 名家專欄

猜你喜歡

您現在的位置：首頁名家專欄