大模型產品化，不過是三支舞

2024-06-13 18:41:06 編輯： robot

導讀今天，擺在全球數百個AI大模型面前的，是一個共同的問題：如何賺錢。無論模型誕生地在中國還是美國，無論屬於通用大模型還是垂直大模型，商業化可以說是這項技術在全球範圍內共同面對的問題。在大模型最初所...

今天，擺在全球數百個AI大模型面前的，是一個共同的問題：如何賺錢。

無論模型誕生地在中國還是美國，無論屬於通用大模型還是垂直大模型，商業化可以說是這項技術在全球範圍內共同面對的問題。

在大模型最初所帶來的震驚與喜悅過後，是大量AIGC平台走向免費开放，大模型toB服務大打價格战。花樣繁多的大模型，似乎始終無法激活用戶的付費欲望。

而大家都知道，商業化的前提是產品化。雖然大模型帶來的AIGC能力本身就有着非常強烈的產品化屬性，但以一種軟件應用來說，它還是過於粗陋和黑箱了。用戶需要自己去探索AIGC究竟能帶來什么，可能性有哪些，從而很難獲得確定性的產品滿足。另一方面，大模型在技術上的潛力也沒有被充分挖掘。一些需要在產品設計層面放大的基礎能力，還靜靜地躺在平台那一長串功能簡介裏。

於是，在全球共享的商業化壓力下，大模型產品化开始提速。不分中美，無論是傳統科技巨頭還是新型AI公司，都开始在大模型產品化上發力，推出了五花八門，千姿百態的大模型產品化策略。

這種情況導致很多朋友會有點迷茫。放眼望去，感覺每家廠商都在做不一樣的AI產品，提出全新的AI概念。但仔細想象，好像又說不出究竟哪裏不同。

爲了幫大家克服這種亂花漸欲迷人眼的“AI眩暈感”，我們盤點了目前大模型產品化的三種主要思路。

看不懂大模型產品化的諸多套路不要緊。我們只需要記住，今天的大模型，其實就是在跳三支舞。

通往全模態的胡旋舞

那些國際AI巨頭眼裏的AI產品大概長什么樣，這個問題已經漸漸有了答案：他們可能希望AI跟真人差不太多。

不久之前，OpenAI和谷歌接連發布了新的AI產品，也就是OpenAI最新的旗艦大模型GPT-4o，和谷歌的Project Astra。它們的共同點，是都加入了跨文本、音頻與視覺的信息收集能力。換言之，大模型正在從只能聽、讀、寫，變成同時也能看和說。用戶與大模型之間的交互模式，也在越來越像與真人之間的交互模式，而且大模型可以在200到300毫秒的區間內響應音頻輸入，這已經與人類之間的交流速度大體相同。

GPT-4o被稱作OpenAI有史以來最爲產品化的一款應用，就是因爲它更加重視與用戶之間的互動體驗，打磨了諸如響應速度、具體使用功能等被定義在產品側的細節。更重要的是，GPT-4o开創了一種新的產品模式：它比語音助手的交互形態更多，作用更廣，同時比傳統的AI對話框模式降低了使用門檻，增加了使用場景。

這種AI產品的使用體驗，非常接近於跟真人打視頻電話。很難不讓人想到電影《Her》或者《鋼鐵俠》中的賈維斯，雖然在使用體驗上肯定不如它們，但產品邏輯已經與科幻電影裏對AI的使用想象一般無二。

我們有理由猜想，OpenAI在AI產品化上的思路，就是比對着科幻作品來進行設計的，只不過他們恰好有機會把科幻變成現實。

這種“類視頻電話”的大模型產品模式，本質上是將不同的AI感知、理解、生成能力進行融合，就像胡旋舞會越轉越快，隨着大模型的不斷發展，AI技術也在越轉越快，把不同模態下的信息收集能力與內容生成能力都卷進來。

沿着這條路走下去，有理由相信接下來的主流AI產品會發生這樣的變化：

1.類似Sora的視頻生成能力，將很快融合到主流通用模型中。讓AI應用能夠同時聽、看、讀，並且能夠生成包括文字、代碼、音頻、圖片、視頻在內的種種內容。

2.垂直類的AI模型生存空間會越來越小，通用模型集成的能力不斷增多。就像GPT-4o裏的“o”是Omni全能的意思。全能，將是AI產品主要的發展方式。

3.AI的記憶能力會越來越強，從而導致“全能+定制化”成爲AI應用的主要發展思路。

雖然在目前階段，大模型在很多時候還是爲了與搜索、繪圖、語音助手等能力結合。但隨着全模態感知，全模態理解，全模態生成的“三全大模型產品”不斷發展，大模型將不再是一種賦能技術，而是更傾向成爲獨立且全新的產品形態。

這個產品方向雖然還不成熟，但方向的確定卻意義重大。

類“視頻電話”的AI應用，可能是除了機器人管家之外，人類對AI的最根本想象。它的出現和發展，意味着AI時代最大的一座海底金礦正浮出水面。

類ChatGPT應用的集體舞

如果大模型是一支足球隊，OpenAI這樣的公司在前場進行突破，那么更多的AI公司、科技公司則需要在中場進行競爭。在ChatGPT爆火之後，OpenAI开始在智能體、文生視頻模型、全模態模型等領域發展，但大量借着這個機會入局大模型的公司，則更多是在打磨自己的類ChatGPT應用。經歷了漫長的內測之後，如今大量聊天對話框模式的AIGC應用走向公衆。這時候問題來了，投入了這么多，也終於可以面向C端用戶开放了，如此費勁，最後要怎么賺錢呢？

於是我們正在目睹非常奇特的一幕：以國產大模型陣營爲代表的大量AI項目，都集中在了類ChatGPT模式這個環節上。向前走的文生視頻等應用還沒有完成研發，而環顧左右則會發現大家的能力大同小異，動作整齊劃一，只有概念口號是個喊個的。

無論是叫AI助手、智能平台、智能對話還是智能搜索，本質上這些大模型產品都是類ChatGPT應用。從最早的文心一言，到通義千問、豆包、Kimi、騰訊元寶、訊飛星火、天工，市場已經充斥了太多的類似產品，大模型變成了一場貨真價實的集體舞。

有一個囚徒困境正在困擾着所有這類產品：想要收費來回收研發成本，但又怕收費引起用戶不滿，把用戶推向競品；想要通過技術能力來實現差異化，但又拿不出真正具有說服力的技術方案，於是只能在概念、名稱、噱頭上下一番功夫。

爲了擺脫這個困境，類ChatGPT應用們也找到了一些產品化方案，我們可以做個總結：

1.开始強調類GPTs模式，以智能體撬動市場升級。

俗話說得好，大模型+對話就是开個場，真正賣票還得看智能體。可定制化，具有專業能力的智能體，被認爲是大模型商業化的真正歸宿。面向這個可能性，各家廠商也开始了自己的探索，包括OpenAI打造了GPTs模式也是如此。

比如說，文心大模型已經正式落地了智能體能力，推出了文心智能體平台；火山引擎也公布了一站式AI應用开發平台扣子。基礎的AIGC對話免費+高階智能體收費的產品模式，是接下來大模型商業化的主要考慮方向。

2.把類ChatGPT產品作爲流量入口。

另一種類似應用的產品化建設思路，是大入口+小收費窗口的互聯網模式，即整體產品免費，但一些特定的功能可能需要开通會員或者使用代幣。收費功能可能相對比較專業，瞄准特定需求人群，或者比較新奇好玩，調動用戶的獵奇嘗鮮心理。

這種模式的問題在於，會把整個產品變得越來越復雜。用戶會有一種在玩免費手遊一樣的“被套路感”。而且整個入口的生態建設也需要更清晰的交互思路，以免用戶剛剛接觸大模型就面對非常復雜，到處都是收費入口的交互邏輯。

3.把類ChatGPT應用與自身優勢結合。

第三種相關產品的建設方案，是結合這些平台類企業其他的優勢項目，從而期望達到1+1>2的效果，至少要將一部分原有平台的用戶綁定到大模型應用上。比如百度就強調將搜索、文庫、網盤等應用與大模型結合，以各種方式調用文心大模型。騰訊元寶則宣布將與公衆號創作生態進行結合，成爲創作助手。

這種生態矩陣玩法，是互聯網產品的一貫思路，但用戶是否能夠由此產生與大模型應用的粘性，是一件需要長期考量的事情。

我們必須尷尬地承認，曾經風頭無兩的ChatGPT，也已經在嘗鮮期過去之後漸漸淡出了用戶熱情追捧的區間。用戶更希望看到的是非常生動、好玩，能夠引發流行趨勢的AI應用，而不僅僅是生硬的對話框。

類ChatGPT應用真正的產品化春天，或許在於打破固化的AIGC對話聊天框架。把其能力抽取出來，變成更具有美感與傳播力的軟件產品。

畢竟集體舞裏能被記住的，很有可能是不按規定動作的那一個。

擬人化的貼面舞

在這些大模型產品化的思路之外，還有一種思路應該得到重視，那就是將AI產品進行擬人。

不久之前，如何讓ChatGPT“越獄”搞一些奇怪事情的教程四處流竄，一些網友掀起了跟AI“談戀愛”的新時尚。無論我們怎么評價這些行爲，必須意識到的是，人類對AI的基礎想象必須是擬人化、類人化的。也就是說，我們需要AI有名字，有個性，跟人類有共同記憶，而不是冷冰冰且萬能的對話機器。

從這個思路看，AI帶來的最大價值是情緒與情感價值。我們需要與人對話，與人分享，和他人建立聯系，但這個人可能也未必需要是真人。這種需求是客觀存在，且具有商業化潛力的。GPT-4o被指責侵權採用了明星的聲音等行爲，其行爲動機都是希望AI更加擬人，能夠讓用戶產生與真人進行對話的想象。

讓大模型擬人化，與用戶跳貼面舞，在接下來商業化壓力越來越大的局面下，很可能成爲很多AI項目的重點選擇。

比如說，豆包大模型當中就推出了角色扮演模型，AI會模仿不同人設、不同性格的人來與用戶進行對話，並且可以通過智能體來自己設定聊天角色。

有人設的聊天，重點是多輪對話的記憶能力。這一點上，也有越來越多的大模型產品強調記憶能力，比如文心一言就強調多輪對話能力帶給用戶的沉浸體驗角色感。

技術難度小，價值可能很大，但容易觸碰法律法規與公序良俗的邊緣地帶。大模型擬人的產品化空間，應該會在未來得到越來越大的重視。由此可能輻射到的數字人主播、專屬AI助手等產品化形式，有着非常充裕的討論和想象空間。

大模型的產品化，目前整體處在一個高不成低不就的尷尬情況裏。向上突破，技術代差依舊明顯，技術的未知領域情形不明；橫向競爭，同類大模型產品過多，已經產生了讓人窒息的擠壓感；向下覆蓋，大多數互聯網用戶其實還對大模型應用沒有感覺，找不到使用與付費的必要性；彎道超車，搞一些擬人項目，還容易觸到各種雷區。

這種情況下，大模型的產品化必須戴着枷鎖跳舞，既要讓觀衆看到，又要小心舞台上的荊棘。

或許在不遠的未來，一個或者幾個天才般的產品化創意，將解決一切大模型的苦厄。但在今天，做大模型產品的主旋律依舊是賠錢賺吆喝，打腫臉充胖子。

原文標題 : 大模型產品化，不過是三支舞

標題：大模型產品化，不過是三支舞

地址：https://www.utechfun.com/post/383973.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤： AI OpenAI AIGC

上一篇:百元AI手機大战萬元旗艦：AI能力有差距，但差得不多

下一篇:暴漲7%股價大喘氣，或許蘋果壓根沒想跑AI競賽

您現在的位置：首頁人工智能

大模型產品化，不過是三支舞

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能