大模型“淘金”的創業者,陣痛比紅利來的還早?

2023-10-19 18:40:08    編輯: robot
導讀 根據北京市經信局公布的數據,截止到2023年10月初,國內公开的AI大模型數量已經達到238個。 盡管學術界對大模型的參數量並沒有明確的標准,許多10億級參數的模型並不能和GPT4相提並論,國內大模...

根據北京市經信局公布的數據,截止到2023年10月初,國內公开的AI大模型數量已經達到238個。

盡管學術界對大模型的參數量並沒有明確的標准,許多10億級參數的模型並不能和GPT4相提並論,國內大模型的爆發式增長,無疑揭示了一個既定事實:和每一次風口出現時一樣,總有人一窩蜂地湧入,試圖在新一輪的創業潮中搏一個機會。

就像創新工場董事長李开復的觀點:AI大模型是絕對不能錯過的歷史機遇。因爲這將是有史以來最大的平台革命,它將比Windows、安卓要大10倍甚至更多,它會讓每個應用改寫,會重構人類的工作,會讓有創意的那些人的聰明才智被放大10倍或者更多......

爲了不錯過“百年一見”的歷史機遇,一場“百模大战”正在上演,可問題在於:當前的大模型战場,當真是屬於創業者的機會嗎?

01 “插件”更像是一種過渡

大模型的爆火,屬於多種因素疊加的結果,其中讓大多數人印象深刻的標志性事件有兩個:一個是ChatGPT的走紅,月活用戶量在兩個月的時間裏就超過一億;另一個是英偉達CEO黃仁勳的比喻,認爲“AI的iPhone時刻已經來臨”。

冷靜下來思考,這兩個事件都有着鮮明的移動互聯網色彩,將月活視爲一個產品成敗的標准,將某個產品的爆炸性增長視爲市場需求被激活的晴雨表。這樣的邏輯是否合理還不得而知,但深深影響了大模型商業模式的構建。

於是,很多大模型都在打造自己的“應用中心”。OpenAI上线了ChatGPT插件,付費用戶可以調用插件解決某類需求,目前ChatGPT上已經有近1000個插件;國內的百度也在積極布局,發布文心一言插件生態平台“靈境矩陣”,並計劃提供百億流量、億元基金等激勵來扶持插件生態。

個中緣由並不難理解。

無論是站在移動互聯網塔尖的蘋果,還是出貨量穩居前五的安卓廠商,無不構建了應用市場的變現模式,衍生出了廣告排名、支付分成、遊戲聯運等多種盈利方式。甚至微信這樣的超級APP,也通過小程序實現了類似的機制。

就現階段來看,像手機廠商一樣經營“插件生態”,可能是大模型平台當下的最佳選項,而开發者同樣樂見其成。

就像移動互聯網催生的流量紅利,灌溉了大大小小的應用,倘若大模型可以沿着移動互聯網的軌跡增長,大概率將帶來了新一輪的紅利。爲大模型平台开發插件,可能會得到平台的流量傾斜,拿到大模型時代的門票,乃至通過“降維打擊”的方式顛覆固有的市場格局。

問題在於,大模型平台能否成爲佔領用戶習慣的入口?在互聯網和移動互聯網時代,入口一詞頻頻被提及,可以細分爲內容、應用、操作系統、硬件四個維度,充當着用戶獲取信息、解決問題的第一觸點。

眼下的挑战在於,坊間普遍認爲通用大模型會趨向寡頭化,最終只剩下兩到三家,开發者選擇加入哪個大模型插件生態,就像是一場豪賭。畢竟ChatGPT的訪問量已經連續三個月下滑,而且功能相似的聊天機器人應用仍層出不窮,在大多數用戶的習慣養成前,無法斷言哪個大模型會是最後的贏家。

把視野再放大一些的話,聊天機器人可能並不是大模型的終極應用,更像是一個啓蒙產品。

比如華爲已經將大模型和語音助手小藝融合,不排除越來越多的智能手機、智能音箱、智能家居類廠商有同樣的計劃,語音助手逐漸成爲人們喚醒大模型的主流方式;再比如一些人鼓吹的Agent,即可以能自主理解、規劃決策、執行復雜任務的智能體,自動幫主人處理一些繁瑣的流程性工作。

無論是哪一種情況,都意味着插件不過是一種過渡,用戶需要的只是連接某個服務,不需要知道服務來自哪個插件。先調用某個插件才能獲得某項能力的交互,注定是大模型初級階段的產物。

02 垂直大模型是金礦嗎?

事實似乎也是如此。不管是ChatGPT還是同類產品,插件的主要貢獻者集中在獨立开發者和人數較少的小團隊,那些手握上千萬用戶和海量數據的產品,好像對插件背後的機會窗口不太感興趣。

畢竟插件生態的主導者是通用大模型,插件的作用可以歸類爲AI+的範疇,目的是爲了擴展大模型的多元能力。借用百度集團資深副總裁何俊傑的觀點:“如果說大模型是一顆聰明的大腦,那么插件就是大模型的手和腳。”

典型的例子就是文檔處理類的插件,調用大模型的能力對用戶的文檔進行處理,再基於文檔完成摘要、問答、創作等任務。插件扮演的終歸是工具的角色,而工具類產品的宿命普遍不太樂觀:風口期收獲了大把的流量,但大多數工具沒能走通變現的路子,風口過後還要买流量來維持增長。

有野心的开發者不甘心做插件,做通用大模型的“寄生品”,瞄准了更有吸引力的選擇:

一種是基於大模型的能力开發獨立應用,或爲自己的應用接入大模型廠商的API,進而提升產品的服務能力;另一種是在通用大模型或开源大模型的基礎上,訓練適用於垂直場景的模型。據說北京市已經有115個AI大模型,其中垂直大模型佔到了103個。

前者的挑战在於,目前的產品主要集中在對話型、繪畫類產品上,且以To C場景爲主。只不過C端用戶仍以闲聊、娛樂爲主,尚未產生實實在在的生產力,導致付費意愿通常比較低。同時還存在產品同質化的現象,以闲聊類產品爲例,早期的產品普遍基於公开語料,假如用戶的提問難以產生有價值的數據,差異化也就無從談起。

To B漸漸成了行業內心照不宣的選項。

大模型的能力聽起來很美好,大多數企業卻用不起來,原因在於通用大模型無法很好地解決垂類問題。對於B端企業來說,可以將自己服務行業的專業知識灌輸給大模型做進一步的訓練與微調,訓練完後在本地進行私有部署,再來解決對應垂類問題。

這就爲垂直大模型提供了充足的想象空間,也是創業者扎堆的賽道。B端企業的場景比較明確,並且積累了海量的數據,既能爲大模型訓練提供數據,還提供了大模型效果的檢驗場。

相對不那么樂觀的是,現階段愿意爲大模型付費的,還只有金融爲首的個別場景,不少行業還在觀望中。以金融大模型爲例,目前發布了金融大模型的企業有螞蟻集團、Bloomberg、MorganStanley、Lemonade、蘇黎世保險、度小滿、瑞穗金融集團等,要么手握海量金融數據,要么有自研大模型的背景,都不是靠一腔熱血闖進市場的創業者。

簡而言之,大模型的想象空間越大,想要從中尋找機會的企業就越多,留給創業者的機會窗口並沒有太多。況且還有一個無法規避的問題:在和大廠同台競爭的過程中,創業者有資本試錯嗎?通往大模型的遠方有千萬條路,也意味着會有千萬個死胡同。

03 創業者“無法承受之痛”

首當其衝的正是合規問題。國內在7月初出台了大模型備案要求,依靠API接口獲取境外大模型能力的模式受到挑战,導致年初時就接入OpenAI做應用的團隊,在不同程度上陷入了困境。

比如某在线設計平台,曾是國內最早推出AI生圖的產品之一,並圍繞AI生圖搭建了社區生態。但在9月初的時候,這家平台突然宣布“網站維護”,一直到一個多月後,依然是“網站升級中”的狀態。而在每天都有新事物出現的大模型行業,早期的先發優勢正不可避免地隨着時間消亡。

和過往幾次“風口”最大的不同,在大模型的曙光面前,創業者很興奮,監管卻很理性,爲了避免大模型市場重蹈野蠻生長的局面,避免大模型走向失控,相關政策和法規密集出台。

就在不久前,科技部、工信部、教育部等10部門聯合印發《科技倫理審查辦法(試行)》,明確提到:算法、模型和系統的設計、實現、應用等遵守公平、公正、透明、可靠、可控等原則,符合國家有關要求,倫理風險評估審核和應急處置方案合理,用戶權益保護措施全面得當等。

幾乎在同一時間,全國信息安全標准化技術委員會發布了《生成式人工智能服務安全基本要求》(徵求意見稿),涉及語料安全、模型安全、安全措施、安全評估等多個方面。

其中在語料安全要求中,不僅明確提出語料可溯源,包括开源語料和自採語料,還提出要建立語料來源黑名單,不使用黑名單來源的數據進行訓練。“應對各來源語料進行安全評估,單一來源語料內容中含違法不良信息超過5%的,應將該來源加入黑名單。”

也就是說,在監管趨嚴的背景下,等待开發者的不單單是備案問題,而是系統性的合規要求。無論是調用大模型API做創新的應用層开發者,還是想在垂直領域分一杯羹的垂類大模型,“蒙眼狂奔”的選項已經消失,必須要謹慎應對潛在的合規和安全風險。

如果开發者基於某個不合規的通用大模型訓練產品,爲了滿足合規需求而切換大模型的話,需要重新處理數據,因爲不同大模型的訓練數據不同,开發者需要重新對數據進行清洗、預處理和標注;需要基於新模型訓練和調優,包括訓練算法、超參數,以及反復的實驗和調整;在模型部署和應用過程中,還要考慮不同的部署平台和框架……

垂直大模型大發展需要應對的潛在風險更多。就像《生成式人工智能服務安全基本要求》中提到的,預訓練、優化訓練等環節的輸入端數據均納入“訓練語料”的範疇,過去靠採集境外數據進行訓練的方案已經行不通,勢必要花更多的精力進行數據採集、清洗、標注。數據影響着大模型的“智商”,同時也左右着垂直大模型的生死。

相比於巨頭們充沛的資源,大模型創業者面臨的挑战將越來越多,現階段是合規,下階段可能就是盈利了。

04 寫在最後

用一句話形容大模型時代的創業者:表面上鮮花着錦,實際上烈火烹油,從搶跑到碰壁,不過才半年時間。

也許大模型時代不缺少機會,但每一條賽道都不會是康莊大道,不缺少衝出一家家獨角獸的機會,比例上注定是九死一生。結果大概率和一次次淘金熱一樣,淘到金子的人寥寥無幾,賣水人悄悄發了財。

       原文標題 : 大模型“淘金”的創業者,陣痛比紅利來的還早?



標題:大模型“淘金”的創業者,陣痛比紅利來的還早?

地址:https://www.utechfun.com/post/278652.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡