全文字數2755
建議閱讀5min
1. 會贏家通喫:代表方吳恩達2. 不會贏家通喫:代表方A16Z3. 有的行業會,有的行業不會:需要看具體的垂直領域4. “大模型”時代怎么投?至少互聯網邏輯確實行不通了
美國硅谷著名投資人,國際知名支付工具PayPal的創始人彼得·蒂爾(Peter Thiel)曾說過:“競爭是留給輸家的。如果你想創造和獲取持久的價值,那就建立一個壟斷企業。”
這句話是對“贏家通喫”(Winner Takes All)的極致表述。“贏家通喫”指一種產品或服務只要比競爭對手好一點點(例如1%),那么在該類別的產品或服務中,你就會獲得不成比例的巨大收入(例如90-100%),將競爭對手遠遠拋在身後。
這個現象在很多行業都有所體現,尤其是科技行業。從全球範圍看,IBM 在計算領域佔據主導地位數十年;微軟主導個人電腦市場;亞馬遜至今仍在單槍匹馬地統治電子商務領域。很顯然,互聯網時代的一大特徵就是“贏家通喫,敗者恆弱”。
搞清楚這個問題很重要,因爲這將會改變我們的投資邏輯:如果傳統互聯網“燒錢補貼——幹掉第二名——壟斷市場——發揮網絡效應”的做法不再行得通,那么經歷過“千團大战”時代的投資人,或許也需要一套新的投資方法論。
爲了得到答案,適道投研團隊參考了幾篇外網文章,作者包括A16Z合夥人Benedict Evans、美國光速創投(Lightspeed Venture Partners)合夥人Guru Chahal等人,試圖梳理出一些相近或相悖的觀點,供大家思考。
1
會贏家通喫:代表方吳恩達
總體來看,吳恩達 (Andrew Ng) 介紹的人工智能的良性循環模式爲“贏家通喫”提供了底層邏輯。
最初,人工智能產品由有限的數據構建。隨後,在與用戶接觸過程中,產品每天會收集越來越多的數據。而機器學習的基礎是數據——大量的數據。
更多數據=更精確的模型=更好的產品=更多用戶=更多數據
這個良性循環公式被認爲是人工智能贏家通喫市場的一個重要因素。大數據和機器學習結合,放大了網絡效應和規模回報,再次強化了科技市場領導者的主導地位,意味那些已經很大並且擁有大量數據的公司會變得更強大。
就國內情況來看,數據壁壘也是擺在新興公司面前的一堵牆。高質量的中文語料數據對創業公司來說是個很大的挑战,而數據的積累則需要時間和經驗。對於百度這樣常年累月通過搜索等多個互聯網、物聯網應用積累起數據的公司來說,一开始就領先了至少幾個身位。
2
不會贏家通喫:代表方A16Z
數據至關重要,但關於數據在實際工作中產生的作用,A16Z合夥人,著名分析師Benedict EvansDoes提出了不同的觀點。
EvansDoes在文章《AI make strong tech companies stronger?》中指出,雖然機器學習需要大量的數據,但是你使用的數據要非常適合你試圖解決的問題。
通用電氣有大量來自燃氣渦輪機的遙測數據,谷歌有大量搜索數據,美國運通有大量信用卡欺詐數據。但你不能用渦輪機數據來訓練模型,去發現欺詐交易,也不能用網絡搜索數據訓練模型去發現即將失效的燃氣渦輪機。
你訓練的每一個模型只能做一件事。
這與之前的自動化浪潮非常相似:就像洗衣機只能洗衣服,不能洗碗做飯,象棋程序不能交稅一樣,機器學習翻譯系統也不能識別貓。
你構建的應用程序和你需要的數據集,都與你試圖解決的任務強相關。(盡管這是一個不斷變化的目標,有研究試圖發現如何讓機器學習模型,在不同的數據集之間更容易遷移)。
這意味着谷歌會越來越擅長成爲谷歌,但不意味着它在其他方面也做得越來越好。
3
有的行業會,有的行業不會:需要看具體的垂直領域
那么,在垂直領域,頭部企業能否憑借遙遙領先的數據優勢,搶佔全部市場?
EvansDoes認爲,情況會變得更加復雜。
比如誰擁有數據,數據有多獨特,數據在什么層面上是獨一無二的,以及聚合和分析數據的正確位置在哪裏。這些問題對於不同的業務部門、不同的行業和不同的用例,答案會有所不同。
我們假設一個場景,如果你正在創建一家公司來用機器學習解決現實世界的問題,那么你會面臨兩個基本的數據問題:
1、你如何獲得第一批數據來訓練你的模型去獲得第一個客戶?
2、你需要多少數據?
第二個問題可以分解成許多問題:
你要用較少且容易獲得的數據來解決問題?(但許多競爭對手可以獲得) 。
還是你需要更多的、難以獲得的數據去解決問題?
如果是這樣的話,是否存在一種網絡效應可以從中受益?由一個贏家將獲得所有的數據?
產品是隨着更多的數據無限期地變得更好,還是存在一個S曲线?
這些都要看情況。
有些數據,是企業或產品獨有的,或具有很強的專有優勢,例如通用公司的渦輪機遙測技術。但這對分析勞斯萊斯的渦輪機,可能也沒有多大用處。
而一些數據,可以用於許多公司甚至許多行業中的用例。許多創業公司也由此誕生,來解決許多公司或不同行業的共性問題,並且這裏的數據具有網絡效應。
但也有這樣的情況,即在某個時間點之後,供應商甚至不需要更多的數據了,因爲產品已經能夠工作了。
EvansDoes認爲,這種情況已經在很多創業公司上演。例如, A16Z的投資的公司Everlaw开發了一個法律軟件。該軟件能夠對一百萬封電子郵件進行情感分析,就不需要以客戶的特定訴訟數據當原料再進行訓練了。
更極端的情況是,一家大型車輛制造商正在通過模型訓練,开發更精確的爆胎檢測器。這是基於大量輪胎的數據訓練出來的模型。但很顯然,這些數據的獲取難度並不高。
也就是說,機器學習的普及並不意味着谷歌變得更強大,而是意味着各種各樣的創業公司,能夠比以前更快地利用這一前沿技術來構建一個應用,解決一個問題。
未來不會出現更多的“人工智能”創業公司,它們將是工業流程分析公司、法律平台公司或銷售優化公司。
EvansDoes將機器學習與SQL(Structured Query Language)進行了類比。
在以前,如果你不使用SQL,你就會落後。例如沃爾瑪成功的一大因素,就是使用SQL更有效地管理庫存和物流。
但在今天,當你創辦了一家零售公司,並說“……我們將使用SQL”,這不會讓公司看起來更具價值,因爲SQL已經成爲了一切的一部分,然後它就在話語體系中消失了。
機器學習的未來也會如此。
4
“大模型”時代怎么投?至少互聯網邏輯確實行不通了
適道投研團隊認爲,不管會不會“贏家通喫”,至少互聯網時代的投資邏輯在人工智能時代不再行得通。
核心邏輯在於,互聯網時代,“流量”是免費的,這才有“網絡效應”的概念:也就是說,在總的運營成本不變的情況下,用戶越多,網絡的價值就越大。這就是所謂的“所有行業都適合用互聯網思維重做一遍。”
但是,大模型時代不一樣的點在於,算力是有成本的。那么每多增加一個用戶,是要實打實地付出算力,並不會產生網絡效應,這就導致補貼沒有任何意義,你的新用戶越多,反而越賺不到錢。
另外,目前的大模型存在使用成本高、推理延遲較大、數據泄漏、專業任務上不夠准確等問題。與之相比,一些更小型、專業化(調整+精煉)的長尾模型的優點也顯現了出來。
因此,即便絕大多數技術都能起到財富聚集的作用,人工智能巨頭也確實能聚集大量財富,但因爲算力成本,以及不能佔有整個市場,財富總量也會變得有限。
原文標題 : AI創業 “贏家通喫”法則消失了?或許你能幹個翻身仗
標題:AI創業 “贏家通喫”法則消失了?或許你能幹個翻身仗
地址:https://www.utechfun.com/post/276002.html