拿不到專有數據也能做好AI應用,頂尖VC們的共識和分歧

2024-07-05 18:41:21    編輯: robot
導讀   熱錢從大模型湧向了AI 應用,有多少誕生,同時就有多少倒下。   去年9月,a16z列出了一份AI應用Top50榜單,如今榜單上的20多款已經掉隊。   國內情況好像更差。一個直觀的判斷:你能喊...

 

熱錢從大模型湧向了AI 應用,有多少誕生,同時就有多少倒下。

 

去年9月,a16z列出了一份AI應用Top50榜單,如今榜單上的20多款已經掉隊。

 

國內情況好像更差。一個直觀的判斷:你能喊出幾個AI應用(不排除在B端)?

 

QuestMobile數據顯示,頭部AIGC App運營數據活躍率低,均在20%以下;忠誠度方面,3日留存均在50%以下;流失風險高,部分App的卸載率在50%以上。

 

一方面是基礎大模型性能不夠;另一方面是沒能和場景完美融合。前者很難靠自己解決;對於後者,不少創業者將希望寄托在專有數據上,認爲即便沒找到商業模式,但根據用戶行爲數據積累,可以實現飛輪效應。這個觀點得到了“OpenAI第一投資人”Vinod Khosla的認可:大家近幾年不大虧就行,重點是讓模型得到盡可能廣泛的使用,目的是獲取大量數據,迭代優化。

 但a16z的兩位聯合創始人卻給“數據護城河”潑了盆冷水。他們認爲,雖然每家公司都能夠通過利用自身數據增強競爭力,但大多數專有數據不具備顯著優勢。

 

對於AI應用,什么才最重要?適道將結合a16z對談Build Your Startup With AI,以及Business Insider對9家頂尖VC投資人的採訪,梳理出可參考的觀點。

1.體驗大於技術 

第一批“屍體”

VC積極尋找真正產生影響的個性化解決方案,而不是通用工具。

 

上一篇文章,我們探討了a16z看好ElevenLabs的原因:ChatGPT確實可以做到一部分,但未來將有更多定制化和垂直的產品出現。

 

由此引出一個問題:如果ChatGPT比現在強大100倍,誰能在“大逃殺”中笑到最後?

 

先上反例。

 

Marc Andreessen表示:你可能懂得如何利用Chatbot,構建SaaS應用,用LLM寫營銷文案,於是你構建了整個系統。6個月後,ChatGPT碾碎了你(疑似內涵Jasper)。

 

Foundation Capital的Moore表示,創始人要先關注能解決的問題,然後再選擇相應的技術。而且,不是每個產品都需要Chatbot。她早已疲於應付拿着通用用例找投資的創企。

 

直到半年前,Moore還會收到大批創始人的推介“我們將成爲企業版OpenAI”。而她的回復是:我非常堅信OpenAI自己會成爲企業版OpenAI。

根據Ben Horowitz的觀點:你必須真正地獨特。如果初創公司能抓住差異化,扎根特定領域,把握所有細微差別等等,即便ChatGPT如何進化,對你也沒有太大影響。但如果你只是盤算着,自家大模型兩年後可以達到ChatGPT-4的水平,那就得考慮要不要繼續。

 

優化流程,提升體驗

對於想做AI應用的創企,如何避免上述情況發生?

 

根本上,Ben Horowitz覺得這個問題有點棘手。因爲涉及“正確性”問題。

 

舉個例子,爲什么AI現在只能當Copilot,而不是主駕?因爲人類不能完全相信AI。

 

一個真正有用的AI應用要能當主駕。問題能解決嗎?反正現在很難,而且你不清楚要從模型層面解決,還是應用層面。

 

不過,Ben Horowitz提出了一個模型不擅長的領域——流程。

 

當你用AI做視頻,包含文案生成、聲音制作、畫面生成等一系列步驟,涉及多種工具。單一的模型不能理解你的終極訴求,但優秀的應用可以。它會將所有工具整合進一個流程,極大地提高制作效率。很多時候,應用是爲了實現某種流程,而不僅僅是技術本身。

 

比如適道測評過SunoV3,雖然它可以自己寫段solo,但只能“一鍋出”,不支持調整分軌。這意味着,如果你要用SunoV3做一首成熟歌曲,必須輾轉於不同的制作堆棧——生成採樣、旋律、人聲,然後一個個拼起來。這對於專業音樂創作者,反而會浪費時間。“小白”一腳踹進“音樂圈”?年輕人靠Suno“搞錢”還差幾步。 

Flybridge的Hazard也有相似觀點——真正聰明的創始人會思考:要么利用基礎構件徹底改變用戶體驗;要么用非常具體的方式完成工作。

 

一些投資人表示,他們不再喜歡“點”解決方案——例如在线支付處理或項目管理——而更傾向於全棧解決方案。

 

Bain Capital Ventures合夥人Rak Garg看重非常垂直的用例。他青睞在特定行業的小領域中引發變革的“超垂直”AI初創企業,並舉了兩個“樣板”應用:

 

EvenUp,主要聚焦在個人傷害索賠領域。律師只需要上傳原告信息,EvenUp就會自動生成一份完整報告,詳細記錄損失明細、傷害明細等等。

 

Norm.ai,主要解決大型銀行的合規問題,識別並消除合規風險,縮短合規時間,實現自動和無限的任務委派。AI高級代理隨時回答問題,並在法律和監管要求的基礎上採取行動。

 

注意!擁擠的賽道始終不被看好。Obvious Ventures合夥人Shah補充:在一些賽道,技術早已商品化。例如筆記和生產力工具、營銷和文案寫作。你必須真正地脫穎而出,才能成爲第N+1家公司。

 

技術不會幫你賺錢

如何判斷應用的價值?要問客戶愿意付多少錢。

 

Ben Horowitz認爲,這才是真正的試金石,用來衡量你所創造的價值深度和重要性。

 

進一步,定價策略如何選?第一種,在成本價上進行合理加價;第二種,用價值定價。即判斷產品對客戶業務的實際價值。如果業務價值是100萬美元,我能否收取10%,即10萬美元?爲什么是10萬美元而不是5000美元?因爲對客戶來說值100萬美元,而他們愿意支付10%。

 

在a16z的投資組合中,有一家專注於追債等服務的初創公司。客戶不可能直接通過ChatGPT追債,但可以通過購买追債服務討回金錢。這就是在價值與成本之間架起橋梁。意味着,即便一些產品在技術上大同小異,但因爲提供了針對商業問題的具體解決方案,對客戶價值巨大,也會賺到盆滿鉢滿。

 

Ben Horowitz補充了另一個觀點:在未來,开源模型和閉源模型的性能差距將會拉平。模型間會進行一番激烈的競爭,成本最低者勝出。那么,真正的價值在於工具層,誰能帶給人們絲滑體驗,誰就能勝出。

2.數據能當護城河嗎? 

數據是否決定成敗?大致分成兩派。

正方:簡直是“命門”,代表Vinod Khosla等。

Vinod Khosla認爲,創企近幾年的目標不是賺錢,而是讓模型得到盡可能廣泛的使用,目的是獲取大量數據,然後不斷進化。

 

構建獨特的應用需要獨特的優質數據。清源創投(Foothill Ventures)創始合夥人王金林分享:從實際來看,能投什么樣的企業,取決於(是否有)比較獨特的應用。它要擁有獨特的優質數據,依賴於其他公司研發的大模型但能夠在獨特數據基礎上做好企業服務,這是有投資價值的企業。

 

另一位硅谷投資人,Fusion Fund創始合夥人張璐分享:擁有海量的高質量數據是企業在AI時代中立足的核心優勢,且數據的質量比數量更重要。我看好醫療是因爲醫療數據大多不在傳統科技公司手中。因爲擔心數據被用於商業目的,這些企業不會將數據分享微軟、Google等公司,它們更傾向於採納新技術來內部實現AI賦能,並傾向於與初創公司合作。

 

風投機構Greylock有些“騎牆派”:可復制的專有數據集能夠制造差異點,而且只有客戶使用產品時所產生的數據才能形成長期壁壘。例如,客戶標記自己的行爲數據或與產品交互產生的數據集。此外,對於許多垂直行業而言,數據留在雜亂的傳統系統中。因此,AI創企的战場從“舊壁壘”——數據來源,轉移到了“新壁壘”——處理數據(包括合成數據)。

 

反方:重要但不絕對,代表NFX、a16z等。

NFX有個著名的“虛無主義”言論——AI應用就是瓶裝水。該機構對幾百家AI應用層創企研究發現:目前在數據和模型上,不太可能實現差異化:非結構化數據可能會在一段時間內給企業帶來優勢,但最終數據本身是不夠的,模型大部分情況下也可以互換。

 

從哪裏找應用差異性?一是用戶體驗。在加密貨幣中,用戶體驗就像喫玻璃。AI現在的問題也是如此,會有人想出一種驚豔的AI應用嗎?但100%不是純chatbot。二是分發。涉及和社交平台硬剛的問題。三是客戶感知價值。這可能就變成了品牌營銷,如何在最豐富、最平淡的材料注入情感價值。

 

a16z沒有如此“極端”,但兩位大佬均否定了“專有數據是最重要的壁壘”的說法。

 

Marc Andreessen講述了一個場景——

 

一家連鎖醫院說:“我有大量專有數據,可以用這些數據來構建AI解決方案,夠獨特吧。”

 

Andreessen認爲:在幾乎所有情況下,這種說法都不成立。上述“優勢”只是一種假象。因爲網上以及各種環境中的可用數據量大到驚人。因此,盡管你拿不到個人具體醫療信息,但完全能夠獲取其他海量醫療信息,這些數據比所謂“專有數據”更有價值。就算“專有數據”有時管用,但大多數情況下不會成爲一個關鍵壁壘。

 

他補充了一個論據,至今我們沒有看到一個豐富或成熟的數據市場。如果數據真的具有巨大價值,它就會有明確的市場價格。這在某種程度上證明了數據的價值並不像人們想象的那么高。

 

Ben Horowitz表示贊同。他認爲原始數據——那些未經任何處理的數據集——價值被過分誇大。比如很多大家認爲最有價值的數據,比如企業自己的代碼庫,很多都存放在GitHub上。而a16z合作過的所有企業,沒有一家是基於自己的代碼建立獨立的編程模型。

 

他指出,每家公司都能夠通過利用自身數據增強競爭力,例如Meta借此訓練大模型。但是,大多數專有數據不具備顯著優勢(只有非常特定類型的數據具有真正價值)。因此,如果覺得收集數據能像賣石油一樣變現,或者認爲其是新的石油資源,很不切實際。

 

總結,正方認爲專有數據因稀缺而珍貴;反方認爲專有數據只在少數情況下稀缺。

 

有趣的是,a16z確實剛剛給一家AI搜索引擎Hebbia領投1億美金。Hebbia瞄准了大量不公开數據,號稱可以讀取並理解沒有被接觸到的非結構化私人數據。其官方博客更是挑釁Google——只索引了全球4%數據,而自己要處理剩下的96%。如果真的如此,那么所謂專有數據,實際是在“裸奔”。

 

順着這條思路,可以提出兩個問題:

 

1、真正“稀缺”的數據到底是什么?Ben Horowitz又講述了一個場景:對於保險公司來說,你能獲取一般數據庫中人們的壽命信息,但不知道他們的具體健康狀況和生活習慣。此時,真正有價值的數據是,具有特定檔案和實驗室結果的人群,他們的預期壽命是多久。

 

2、數據越多、越好,頂層的應用就會變得越好嗎?如果是,數據的質量和“海量”誰更重要?如果不是,那么體驗和數據孰輕孰重?適道認爲,短期內數據會帶來飛輪效應,且體驗優化取決於數據,但長期來看,如果AI應用出現“通脹”,數據的護城河作用也要打個問號。期待在評論區看到各位的精彩觀點。

本文作者:適道AI組,編輯:獅刀

本文圖片來源:網絡配圖

       原文標題 : 拿不到專有數據也能做好AI應用,頂尖VC們的共識和分歧



標題:拿不到專有數據也能做好AI應用,頂尖VC們的共識和分歧

地址:https://www.utechfun.com/post/393478.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡