導言
8月14日,雷軍宣布小米科技战略升級,並公布了升級後的科技理念:選擇對人類文明有長期價值的技術領域,堅持長期持續投入。
“深耕底層技術,長期持續投入,軟硬深度融合,AI全面賦能”,這是小米科技战略升級的四個關鍵路徑與原則。雷軍表示,軟件硬件深度融合,是爲用戶提供獨特體驗的根本保證,而AI則是未來的生產力,也是小米長期持續投入的底層賽道之一。
自2016年組建AI團隊至今,小米人工智能團隊人員規模已達3000多人。今年4月小米組建了AI大模型團隊,8月14日晚,雷軍正式宣布了小米的大模型战略:全面擁抱大模型。據悉,小米旗下的智能語音助手小愛同學將接入大模型能力,並於14日开啓邀請內測。
雷軍稱,小米大模型技術的重點突破方向爲“輕量化、本地部署”,小米考慮的是優先在手機上實現端側跑通,讓每個人都能更好在手機上使用大模型。
面對新一輪產業與技術變革帶來的時代巨變,大巨頭公司也好、小巨人企業也罷,都紛紛入局大模型賽道。當前“百模大战”進展到什么階段,本文可以爲您提供參考。
來源 | 零壹智庫
2023年以來,科技圈最熱的詞語就是ChatGPT及其背後的大模型技術。
此前有百度文心一言、阿裏雲通義千問、華爲盤古、科大訊飛星火等,近期李开復入局建立零一萬物、火山引擎推出“火山方舟”。短短數月,各類企業研發和發布大模型應用已成潮流。
國內10億級參數規模以上大模型已超80個,並且還在快速增加。一場圍繞大模型的商業战爭的備战氛圍已經極爲濃厚。
大巨頭公司也好,小巨人企業也罷,都需要這樣的動作展現自身對前沿科技的敏感度與長期以來的積累。早一步推出應用,便可早一日測試大模型與用戶交互上的寶貴數據,在未來競爭中“廣積糧,圖稱王”。
大模型的關鍵的還是AI領域要素——算法、算力、數據,以及場景/應用。算法代表策略,算力決定上限也設置了門檻,數據等同軍糧也象徵着優劣之分。三要素之外,場景/應用代表出兵方向。
“百模大战”爆發,要素齊備的巨頭公司是否會演變成技術能力的無限內卷?垂直賽道的小巨頭能否借助大模型夯實自己的領先地位?在獲得門票的新玩家中,誰有可能是行業統治地位的有力競爭者?
01
通用大模型“實力分水嶺”未現
大模型的玩家主要分爲三類:一是在資源與場景上具備身位優勢的互聯網(百度、阿裏、騰訊等)和產業巨頭(中國電信與中國聯通等),二是專研AI的人工智能公司(商湯、雲從、光年之外等),最後一類則是以上海人工智能實驗室、復旦大學、哈爾濱工業大學等爲代表的科研院所單位。
根據公开數據,截至2023年7月初,我國10億級參數規模以上大模型已超80個,且還在快速增加。該參數量的大模型越多,標志着競爭門檻將逐步拔高。
目前已經發布的大模型絕大多數屬於通用大模型,原因主要有兩種:一是大模型競爭尚不明朗,純粹技術層面並未拉开代差,行業參與者都有機會稱霸江湖;二是面向公衆的應用型大模型仍未出現,缺乏較爲明確的方向指引,在國內大模型的“Chat GPT時刻”出現前,投身通用大模型是既主動又被動的無奈之選。
何況,大模型領域極有可能走出一個新巨頭。
周鴻禕認爲,大模型必須“通用”,只有通用才能走進千家萬戶、賦能百行千業,進而主導人工智能新革命。
話中未盡之處是,需要多少投入和配合才能成爲引領新革命的主導者。不管大模型是藍海還是紅海市場,必然要存在大魚領銜、小魚配合的生態結構,而目前大魚和小魚之間的實力分水嶺仍未出現。
以當前局勢看,10億參數規模的大模型可以視爲入局門檻,100億參數規模的大模型可認爲具備逐鹿天下的能力,但即使是1000億參數規模的大模型也遠未達到一騎絕塵的領先水平。
參數量並非決定战場局勢的壓倒性力量,資源調度能力、長期經驗積累、大額科研投入等因素都是大模型競爭中長期存在的核心差異點。
要對標Open AI,需要看清Chat GPT爆發背後是微軟在數據、算力、海量資金上的全面支持,才有了之後的厚積薄發。
大模型是長期投入的行業,簡單來說就是“燒錢”。算力、算法與數據的積累非一夕之功,模型發布之後還需要反復訓練、敏捷迭代,最終不斷演變爲“成熟體”。
放到現實環境下,大模型的玩家是技術驅動還是利益驅動?Open AI是當下全球最知名的大模型公司,即便手握Chat GPT這一爆款產品,其商業化能力仍然堪憂。作爲一家逼近300億美元市值的科技企業,2023年身處AI浪潮中心,Open AI至今收入仍不過2億美元。
初期投入只是起始花費,之後每一次訓練都需要真金白銀往裏砸,有多少公司能否接受大模型競爭中那少得可憐的投資回報率?Chat GPT的成功,證明了大模型在產品路徑上的打通,但並不意味着商業層面的巨大成功。
至少在投入產出比層面,互聯網巨頭相對優勢更大,他們有足夠的動力和資源去支撐前期的战略性虧損,一如當年的阿裏雲。
至於到底燒錢要燒多久,何時才能看到喜人的投資回報,大公司不知道,創業公司的VC也不知道。這是一場隨時可能離場的豪賭,而籌碼動輒數十億美金。
對於“人有我優”的大模型玩家而言,優先探索應用層,及早开放測試,誰能積累更爲珍貴的交互數據,將是接下來競爭的破局點。
02
垂直之需與垂直之困
通用大模型的角逐,更多是基礎設施制定權的爭奪,而垂直大模型,則是在特定場景中依托开源大模型或API接口,在細分行業形成差異化競爭能力,更多聚焦在場景應用。
在通用大模型的战場上,隨着時間推進,一些力有不逮的玩家會逐步掉隊,最終只會存在寥寥數個通用大模型,起到基礎設施的作用。同時,這些大模型還面臨着同質化問題,應用層仍然要靠垂直大模型發力。
通用大模型像是多個垂直大模型的集合,訓練場景越多,通用大模型的“通用性”越強。
作爲國內最早發布類Chat GPT產品的公司,百度對大模型垂直應用層的需求十分緊迫。李彥宏表示:“比大模型數量更重要的是應用,是在垂直領域應用的突破。新的國際競爭战略關鍵點,不是有多少個大模型,而是大模型上有多少原生的應用,這些應用在多大程度上提升了生產效率。”
按照李彥宏的比喻,大模型尤其是通用大模型就像是AI時代的操作系統,所有的應用都將圍繞着大模型开發,其上是應用層,包括各種各樣的AI原生應用。
歸根結底,所謂的“通用”只是一個相對概念,並不存在完全適用於所有領域、具備足夠行業深度的通用大模型。以Chat GPT爲例,真正得以廣泛應用的仍是一些容錯率較高的行業,即便大模型給出的解決方案出錯,錯誤也局限在較爲有限的範圍內。而在重工業、航天、醫療等場景中,一次錯誤所造成的損失不可估量,即Chat GPT不能滿足特定場景的垂直性、專業性要求。
要兼顧垂直性與專業性要求,數據是硬傷,數據深度足夠且能形成穩定護城河的行業更少。這些行業的數據是否便於獲得,已經獲得的數據能否滿足特定行業日新月異的要求,都很難具體評定。
互聯網巨頭擁有大量電商、社交、搜索等網絡數據,但數據類型不夠全面,數據質量也沒有保障,中文可供訓練的語料還需要做大量的挖掘工作。
近期在政務、公共安全、醫療等領域,垂直大模型正在陸續落地。例如,雲知聲在智慧醫療領域自研“山海”大模型,結合前端聲音信號處理、聲紋識別、語音識別、語音合成等全棧式智能語音交互技術,預計可提升醫生的電子病歷錄入效率超過400%,節約單個患者問診時間超過40%,提升醫生門診效率超過66%。
拓爾思基於自有的公文、政策文件、政務辦事指南等數據作爲專業訓練數據,打造了政務專業大模型。
金融領域內,恆生電子2023年3月底开始籌劃、設計金融大模型產品。6月末,恆生電子和旗下子公司恆生聚源發布基於大語言模型技術打造的數智金融新品——金融智能助手光子和全新升級的智能投研平台WarrenQ,恆生電子金融行業大模型LightGPT也首次對外亮相。
騰訊這種具備多個行業資源的互聯網巨頭則是多面下注。在6月下旬,騰訊公布的MaaS服務解決方案覆蓋了金融、文旅、政務、教育等10個行業,共有超50個解決方案。
同時,垂直大模型所需要的數據往往並不局限在本行業,某些業務也許需要另一個或多個行業的數據整合,其模型訓練和應用就依賴於企業的跨業合作或者互聯網巨頭的資源整合。
03
算力:力大磚飛?
在19世紀美國西部的淘金熱中,淘金者能真正賺到錢是概率性事件,而賣鏟子的人賺到錢則是必定性結果。
AI淘金熱中,大模型的战場局勢還不明朗,玩家尚在前赴後繼,但“賣鏟人”已經贏麻了。英偉達靠AI芯片與大模型的潮流拉开了與競爭對手AMD的差距,市值步入“萬億美元俱樂部”。
Open AI CEO薩姆·奧爾特曼提出了新版摩爾定律,即全球AI的運算量每隔18個月就會提升一倍。維持這些運算量需要AI訓練芯片支持,而這一領域英偉達的市場份額超過90%。
英偉達的AI芯片產品被全球各大科技企業瘋狂搶購:2023年3月,微軟宣布已幫助OpenAI建設了一個新計算中心,配置了數萬塊A100;5月,Google推出了一個擁有2.6萬塊H100的計算集群ComputeEngineA3。另外,據國金證券信息,字節跳動今年已訂購了超過10億美元的GPU,到貨和沒到貨的A100與H800預計有10萬塊。騰訊發布的騰訊雲新版高性能計算服務中心也採用了上萬塊H800芯片。
英偉達CFO克雷斯表示,目前AI 算力市場的需求已經超出了公司對未來數個季度的預期,訂單已經多到做不過來了。
當然,英偉達賺的錢,我們羨慕也沒用。
國內GPU賽道也在迎頭追趕,既有互聯網巨頭自研AI芯片,如百度AI芯片昆侖、騰訊視頻處理芯片“滄海”和AI芯片“紫霄等,也湧現出燧原科技、天數智芯、摩爾线程等研發通用GPU的新興公司。通用GPU用於各種通用任務,包括具有高度的並行計算能力和大規模的計算核心,是高性能GPU的“下位替代——平行替代”的主要產品,近年來也有大進步,與高性能GPU的差距也在逐步縮小中。
中國工程院院士鄔賀銓建議,在國家科技與產業計劃的協調下合理分工形成算力合力,开放國家實驗室的算力平台支持各類大模型訓練,同時建議組建算力聯盟,集中已有高檔GPU的算力資源,提供大模型數據訓練所需算力。
除了高性能GPU之外,成本更低的算力平台也被認爲是新的市場機會。近期九章雲極便透露將繼續與國資雲廠商合作,把市場上大量的智算中心納入合作夥伴範疇,向客戶提供集軟硬件於一體的AI模型研發平台,客戶的費用將與算力綁定。
算力是發展大模型的基礎,是必要條件而非充分條件,算力所能發揮的最大作用仍取決於使用方向。只有算法創新與數據資源建設、訓練框架迭代齊頭並進,才有創造“力大磚飛”的可能性。
04
政策:關鍵時刻的引導與規範
推薦閱讀 | 70部人工智能政策解讀:產業側重和方向差異
AI大爆炸時期,恰逢我國算法治理與算法備案的關鍵時刻。
早在2021年,《關於加強互聯網信息服務算法綜合治理的指導意見》就把算法備案管理作爲監管體系完善的重要一環,此後的《互聯網信息服務算法推薦管理規定》和《互聯網信息服務深度合成管理規定》都明確規定或提及,“具有輿論屬性或者社會動員能力的算法推薦服務提供者應當履行備案手續”。
2023年4月,國家網信辦起草了《生成式人工智能服務管理辦法(徵求意見稿)》,公开徵求意見(注:該辦法已審議通過,自2023年8月15日起施行)。6月,國務院印發的《國務院2023年度立法工作計劃》顯示,人工智能法草案等預備提請全國人大常委會審議。
《生成式人工智能服務管理辦法(徵求意見稿)》提及,利用生成式人工智能產品向公衆提供服務前,應當按照《具有輿論屬性或社會動員能力的互聯網信息服務安全評估規定》向國家網信部門申報安全評估,並按照《互聯網信息服務算法推薦管理規定》履行算法備案和變更、注銷備案手續。
這也是當前尚未有大模型產品面向公衆的原因之一。
南开大學法學院副院長、中國新一代人工智能發展战略研究院特約研究員陳兵教授認爲,監管前置並不必然會損害技術創新,但需要注意的是,由於事前審查會在一定程度上增加企業的合規成本,若事前審查範圍設置不當,可能會抑制生成式AI產品的研發與訓練效能,客觀上會導致生成式AI發展的降速。
由於人工智能風險事前無法極爲完善的預估,事後監管又有可能造成巨大損害,故而當前我國對人工智能發展採用全流程監管。
在全流程監管的規範下,大模型玩家的合規成本無疑會增加,備案制又促使着局內玩家優先謀求備案以將產品早一步推廣至市場,客觀上加速大浪淘沙的速度。法規的逐步完善伴隨着行業洗牌、弱者掉隊的過程,也能讓撥雲見日的時刻早一點到來。
原文標題 : AI大模型搶灘手機端?新巨頭何時誕生
標題:AI大模型搶灘手機端?新巨頭何時誕生
地址:https://www.utechfun.com/post/250080.html