文|劉雨琦,編|王一粟
身處大模型的浪潮之中,AI的熱度一波接着一波。
7月6日,2023年世界人工智能大會在上海召开,一度衝上了微博熱搜榜。在5萬平方米的會場中,400多家企業的展台員工都在不遺余力地講解着自家新產品,參會的人們不斷穿梭其中,“腳都走麻了,但心情還是很澎湃。”有觀衆說道。
在現場,光錐智能發現大會的展台均是按行業部署,軟件、硬件、芯片“一家人整整齊齊”的排列着。阿裏、百度、騰訊三連座,無異於同台競技,而觀衆們能在5分鐘之內縱覽全國最新大模型,邊看邊對比。
作爲國內最大的AI盛會,此次與往屆不同的是,通用人工智能的曙光似乎就在咫尺之間,群雄逐鹿的战意感染了每一個見證者。
特斯拉創始人、CEO埃隆·馬斯克連线开場,圖靈獎得主、中國科學院院士、上海期智研究院院長姚期智主持討論此次大會,不僅集齊了百度文心、阿裏通義、華爲盤古、訊飛星火、商湯日日新等30余個海內外大模型,還有80余位國內外院士,特斯拉、微軟、華爲、阿裏等50余位海內外大咖,學術界與科技界正在合力推开時代厚重的大門。
最爲基礎的大模型層,技術平台迎來新的迭代升級,如何賦能千行百業,推進產業落地成爲新階段的探討主題。
AI infra結構雖然尚不成熟,但大模型的配套設施跟了上來,適應大模型計算存儲的向量數據庫成爲熱門賽道,保證大模型安全運行的AI安全監測平台順勢而生。
應用落地搶在了大模型成熟的前面,軟件應用滲透至各行各業場景,硬件端又催生了一批機器人新產品。
中國大模型跑出了中國速度,技術層、配套設施層、應用層,同時在各個環節同步崛起,而不是等着底層大模型技術成熟後才慢慢跟上。一面繼續夯實地基,一面遍地开花,整艦加速前進,衍生出更多的中國大模型模式。
?大模型,兩條腿走路
從3月如雨後春筍般冒頭至今,短短4個月的時間,大模型正在從“通用型”走向“產業落地”。
通用大模型是一場“贏家通喫”的大逃殺,把大模型用起來,比做出來更重要。在此次世界人工智能大會上,所有大模型升級的關鍵詞都是“產業”。
作爲大模型的提供方,螞蟻、騰訊、百度、阿裏、華爲、網易等大廠結合此前已有領域的經驗優勢,快速探索垂類場景應用。
阿裏的通義千問大模型,就率先用在了智慧金融。通過將自然語言理解和生成能力與金融場景結合,通義千問與中金財富、杭州銀行、恆生電子等合作,通過智能問答、智能外呼、智能助手,來幫助企業識別市場風險、理解客戶需求。
以遊戲和教育爲主的網易,則將大模型率先與這兩個領域結合。在教育領域,網易有道自研了國內首個教育大模型“子曰”,在此次大會還發布了最新應用成果——虛擬人口語教練,可以1V1體驗類似真人的口語私教。
而在自動駕駛領域積累多年的百度,把大模型投入了汽車交通領域。在汽車制造領域,百度智能雲爲長安汽車提供了人工智能基礎設施平台和數字人平台,與吉利汽車一起打造了汽車行業大模型,構建了工廠數字化大腦,幫助降低管理運維成本。
正如華爲輪值董事長胡厚崑提到,“人工智能的發展關鍵是走深向實,着力點放在讓人工智能爲千行百業的生產活動服務,爲科研創新服務。”
不過,這波中國大模型們產業落地的姿勢雖各不相同,但在優勢領域站穩後,都开始一致向外擴展,比拼起了行業覆蓋能力。
以騰訊爲例,目前,騰訊雲已經爲傳媒、文旅等10余個行業提供了超過50個大模型行業解決方案;華爲的盤古大模型則主要與金融、制造、醫藥研發、煤礦、鐵路等行業相結合落地......總體而言,智慧政務、智慧金融、智慧交通成爲搶手垂類賽道。
騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生表示,“通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業某個場景的需求。”
爲了提升行業大模型的競爭力,企業們需要深入垂類行業的具體場景,貼身肉搏真正考驗技術的細節與效果。
作爲持續進化的技術,大模型光能用起來還不夠。正如每一個技術的發展,都需要兩條腿走路,一條是實用性,一條是先進性,大模型的實用性,是借由產業側落地逐步探索的,而先進性則體現在對跨模態難題的突破。
參考ChatGPT從3.5到4.0的路徑,生成式大模型的技術前進之路,是單模態到多模態的,從一开始同質化嚴重的文生文,正在一路向文生圖、文生聲、文生視頻演進。
在通義千問之後,阿裏雲此次宣布推出“通義大模型”新成員AI繪畫“通義萬相”,與文心一格、商湯秒畫類似,文生圖賽道已經擁擠起來。
而在文生圖之後,文生聲、文生視頻是接下來的賽點。
以視頻爲例,作爲文、聲、圖的結合體,文生視頻也是生成式大模型的終極形態。目前,文生視頻技術的難點在於連貫畫面素材的生產。基於數字人的已有技術,文生視頻最快在數字人場景實現。
例如,商湯的如影大模型,能將文本文案,一鍵生成知識分享、品牌宣傳、短視頻帶貨、培訓宣講、熱點資訊等各類數字人視頻,以及3D內容生成平台“瓊宇”(場景生成)、“格物”(物體生成),基於3D內容生成技術對空間和物體復刻與交互。
以往,技術往往都是先發展,後應用。而在這一波大模型浪潮下,技術的先進性、實用性同步發展,兩條腿走路的大模型正在加速前進。
產業拼圖,逐個補齊
大模型狂奔了4個月,產業的拼圖,也在一塊一塊逐漸補齊。
以大模型爲核心的MaaS服務平台,是大模型飛機着陸的機場。大模型如何落地、落地速度,都與這個機場平台的建設成熟程度緊密相關。
目前,百度文心千帆、阿裏靈駿PAI平台、騰訊模型商店、火山引擎的火山方舟,雖然有細分的差別,但都是MaaS服務平台,幫助企業更好的精調、部署行業大模型,將大模型應用在產業中。
WAIC中,MaaS平台的升級也是一大主要看點。會上,騰訊雲公开了幾大重點行業方向,包括金融風控、交互翻譯、數智人等創新場景,下一步將布局AI for Science,持續通過AI 大模型應用在天文探索、文化考古等領域。
在不久前,火山引擎也發布了MaaS服務平台火山方舟,包括模型廣場和模型工具兩個重要模塊,核心目的也是通過平台力量幫助企業更好的做應用落地。
而在發展的過程中,安全問題也逐漸暴露出來。
無論是AI詐騙還是三星的員工數據泄露,模型安全一度成爲了社會焦點。現階段,解決問題的前提是發現問題,亮起安全紅燈,才能有的放矢的解決。
爲此,螞蟻推出了可信程度安全評測系統“蟻鑑2.0”,作爲業內首個產業級支持文本、圖像等全數據類型的AI安全檢測平台,“蟻鑑2.0”新增AIGC安全性、AI可解釋評測能力,可服務於金融、教育、文化、醫療、電商等領域10多個大規模復雜業務場景。
另外,螞蟻還將發布以隱私計算技術爲核心的隱語开源框架1.0版本、“隱私計算安全對战”科普互動遊戲,數字版權保護平台“鵲鑿”等。
螞蟻的技術人員告訴光錐智能:“當面對多模型決策時,企業可以將大模型开放給蟻鑑平台進行評分,將有4個不同的評分標准,就像論文的查重系統,檢測模型的安全指數並打分,爲企業提供指導。”
不過,據光錐智能了解到,目前,蟻鑑僅能檢測問題,並不提供針對性解決數據安全問題的方案。還需要其他廠商共同完善產業鏈條。
另一方面,數據技術的發展也在突破大模型本身的限制。
正如前文所講,大模型正在經歷從通用到行業的變遷,這個過程受到兩個方面的限制:一是通用大模型只有“短期記憶”,無論是國內還是國外,OpenAI最新發布了GPT4的开源版本中也強調,有8k的Token限制;二是訓練行業專有大模型,企業需要將私有數據與通用大模型進行結合,私有數據如何安全的接入大模型?如何更高效率、低成本的處理動態變化的數據?
這也就是爲什么,大模型火了之後,向量數據庫隨之火爆的原因。
星環科技創始人孫元浩向光錐智能解釋道:“向量數據庫就像是大模型的外腦,能夠幫助大模型擁有長期記憶,且私有數據可以通過向量化存儲在向量數據庫中,既能滿足瞬時接入和輸出,也保障企業私有數據不被泄露。”
爲此,騰訊雲發布了雲原生向量數據庫Tencent Cloud VectorDB,支持10億級向量檢索規模,並將延遲控制在毫秒級。相比傳統單機插件式數據庫檢索規模提升10倍,同時具備百萬級每秒查詢(QPS)的峰值能力。
星環科技發布了分布式向量數據庫Transwarp Hippo。支持存儲、索引以及管理海量的向量式數據集,提供向量相似度檢索、高密度向量聚類等能力,有效地解決了大模型在知識時效性低、輸入能力有限、准確度低等問題。
向量數據庫火爆的背後,是大模型帶動着整個數據產業鏈向前發展。
在訓練大模型之前的數據准備(清洗、過濾、提純)、數據處理(選型、質量、標注)在經歷了數道工序後才能“喂”給大模型,而中國目前數據產業相對分散,導致數據在流通的過程中容易遇到安全問題,且效率不高。
比如,需要先把復雜的非結構化數據通過向量化(embedding),處理統一成多維空間裏的坐標值,才能夠爲大模型所用,但如Zilliz一類的向量數據庫,並不幫企業完成向量化的過程。
這就需要一個一站式的數據處理平台。和數據打了十幾年交道的孫元浩,將經驗凝結在了星環的Sophon LLMOps中,通過該平台,用戶可以完成數據採集、知識沉澱、大模型迭代提升的完整閉環。同時將向量數據庫與圖數據庫進行結合,能夠更好的幫助大模型跨領域知識學習和調優,讓大語言模型能更好地理解不同領域的專業術語、縮寫、常見詞匯和語法,承擔統一的語義理解功能,解決業務領域性問題。
產業鏈的陸續補齊,是大模型發展的基石,同時也將帶起諸多的產業鏈機會,共建一個完整的模型生態。
軟件、硬件,兩手抓
今年整個展覽館,素有“人氣王”之稱的機器人被數字人搶了風頭。
數字人展館外人頭攢動,圍了一圈又一圈。商湯搭建如影數字人生成平台,現場演繹3D數字人生成過程;網易有道豎屏展示虛擬人口語教練,吸引了參展人上前互動;魔琺科技還原虛擬人試播間,虛擬人一上午連播三場。
雖然,近期AI主播、AI數字人大規模湧入了短視頻平台,掀起了一波討論熱度,但逛完一圈卻發現沒人展出2D數字人,顯然相比其實用性,酷炫、好玩、互動性強的3D數字人更能搶奪人們的目光。
走進AI繪畫平台的場館,依然令人眼花繚亂。阿裏打造巨屏展示其文生圖效果,商湯使用超大卷屏演示其秒畫功能。數字人、AI繪畫,AIGC儼然成爲大衆最關心的事兒,也是大模型應用中跑得最快的方向。
AIGC熱度居高不下,成爲了人們茶余飯後的談資,不過更重要的是要推進產業落地。
網易伏羲預訓練及生成式人工智能平台負責人趙增告訴光錐智能,目前遊戲是圖像生成的核心應用場景之一。“遊戲場景需要創作大量的內容,例如各種不同朝代的角色,世界各地的風景,通過文圖功能可快速生成手稿,激發創意,提升遊戲制作效率。”
光錐智能逛展過程中發現,相比於年初,市面上內容生成的類型變得豐富了起來。文生圖幾乎是各家的標配,除此之外,更多維度的多模態能力越來越完善。比如,騰訊利用文生音頻技術,在音樂創作領域推出了XMusic生成式通用作曲框架。
從最初的文生圖,到現在的文生音頻、圖生圖,生成內容的類型越來越多樣化,呈現出從單模態走向多模態的趨勢。但這還遠遠不夠,參照國外Midjourney一類軟件的發展,文生視頻將是下一階段的方向,而國內公司在這方面探索還處於特別早期。
“左手軟件,右手硬件”,AIGC應用落地正在表現出“兩手抓”的趨勢。
大會剛开幕,馬斯克在發言中就提出:“未來人類將會有更多機器人產品,預計地球上的機器人數量將會超過人類數量。
據了解,今年現場共20余款機器人共同亮相,多款爲首發,包括達闥搭載大模型對話能力的雙足機器人、特斯拉人形機器人擎天柱、網易伏羲具身智能工程機器人、微創手術機器人、美團無人機V4、宇樹四足機器人、科大訊飛機器狗、雲深處絕影Lite3四足機器人等。
大模型讓軟件重做了一遍,但離實際應用到機器人行業還有很長的距離。
長期以來,機器人一直面臨前端需求不足、單體成本太高、無法規模化生產等難題。某機器人廠商市場負責人向光錐智能透露,幾年間,我們的機器人成本降低到此前的三分之一,但於行業而言,在實際應用中還有很多未知問題需要磨合。
上述負責人表示,理想狀態下,大模型能夠使機器人長出靈魂,讓它自主做決策,跟實際環境去互動。
但遺憾的是,目前還很難做到,機器人的邊緣端資源有限,已有的算力帶不動大模型部署,而部署了高昂的GPU又會繼續拉高機器人的單價。
對此,有創業者稱,AI技術路线尚未走通,可能五年之內也難出現大規模人形機器人的產品形態應用。
不過,包括馬斯克在內的多位企業家都認爲,機器人是人工智能的“具身智能”落地。在更長期的未來中,機器人的成熟會將人工智能的應用從信息產業,帶向更深更大的實體世界中。
結語
中國大模型正處於一片欣欣向榮的態勢。
不過,行業熱鬧之中,我們也看到了大模型技術路徑、產業落地、配套設施搭建、應用生態仍處於早期階段。
正如阿裏雲周靖人所說,“大模型領域你追我趕的過程剛剛开始,大家還是要有一些耐心。”
原文標題 : 縱覽2023世界人工智能大會:百模大战4個月,中國AI產業怎么樣了?
標題:縱覽2023世界人工智能大會
地址:https://www.utechfun.com/post/235607.html