經濟觀察報記者不完全統計發現,在新一輪生成式AI熱潮中,全國已經出現了106個大模型,其中北京的大模型公司數量和研發數量均佔據“C位”,多達54個;上海在AI算力方面積累了優勢;深圳、廣州、杭州、成都等城市也都有多個大模型公司。
作者:任曉寧等
一場關於大模型的地域競速已經开始。
“現在已有80余個大模型公开發布,其中北京約佔一半”,北京市經濟和信息化局黨組書記、局長姜廣智最近在接受媒體採訪時說。
經濟觀察報記者不完全統計發現,在新一輪生成式AI熱潮中,全國已經出現了106個大模型,其中北京的大模型公司數量和研發數量均佔據“C位”,多達54個;上海在AI算力方面積累了優勢;深圳、廣州、杭州、成都等城市也都有多個大模型公司。
今年4月28日,中共中央政治局會議提出,要重視通用人工智能發展,營造創新生態,重視防範風險。5月5日召开的二十屆中央財經委員會第一次會議指出,要把握人工智能等新科技革命浪潮。之後,全國各地相繼推出大模型扶持政策。搶佔新一輪AI高地,各大城市正在行動中。
目前,各地大模型均還在內測中,未开放給公衆。大模型發展仍處於混沌初开時刻,最終誰能勝出,成爲真正的“大模型之都”,還需繼續觀察。
北京:54個
姜廣智的話並不誇張,據經濟觀察報不完全統計,截至7月13日,北京已有54個大模型公司。
中關村是北京大模型公司的核心聚集地。經濟觀察報記者在五道口走訪時,方圓3公裏內,就坐落着近10個大模型創業公司,它們也都是中國大模型公司中的佼佼者。
五道口清華大學南門外,搜狐網絡大廈3層,是王慧文創辦的光年之外。這家公司成立剛4個月,以20.65億元的價格被美團收購。搜狐大廈對面是智源大廈,北京智源人工智能研究院坐落其中,院長是北京大學計算機科學技術系主任黃鐵軍,這是學院派的中堅力量之一,早在2021年,智源就推出了中國首個超大規模預訓練模型“悟道2.0”,參數量達到1.75萬億。
智源大廈往南800米,是王小川創辦的百川智能,7月11日,百川智能發布參數量130億的通用大語言模型“Baichuan-13B-Base”。
距離智源大廈3公裏外的丹棱街上,MiniMax北京團隊在這裏辦公,這是當前國內估值最高的大模型創業公司,6月最新一輪融資後,估值12億美元。丹棱街1公裏之外,是銜遠科技的辦公室,這家公司由京東前AI掌門人周伯文創辦。
坐落在中關村附近的,還有李开復的大模型新公司“零一萬物”,這家公司7月3日剛成立,目前團隊已經有數十名核心成員。
出門問問創始人李志飛的公司也在海澱,他們推出了大模型產品“序列猴子”。這附近也有互聯網大廠推出的大模型產品,比如位於知春路的字節跳動,在6月28日發布了大模型服務平台“火山方舟”。
如果把中關村的範圍擴大到方圓10公裏,大模型公司更多。中關村向北10公裏,是互聯網大廠的聚集地後廠村。今年3月,百度在百度科技園裏發布了文心大模型,是國內第一個互聯網大廠發布的大模型。
同在北京發布大模型的大廠,還有位於望京的360,今年發布了“智腦大模型”。位於亦莊的京東,發布了“言犀大模型”。
北京還有一批中等規模公司也發布了大模型,比如昆侖萬維的“天工”、知乎的“知海圖”、網易有道的“子曰”、第四範式的“式說”……
根據IDC《2022-2023中國人工智能計算力發展評估報告》,北京位居2022年中國人工智能城市排行榜首位。獵聘研究院發布的《AIGC就業趨勢大數據報告2023》顯示,在近一年AIGC新發職位城市分布TOP10中,北京職位最多,佔比爲22.21%。
AI政策扶持方面,北京市正在發力。5月份,北京市政府12天內連發3個AI相關文件。5月19日,發布《北京市通用人工智能產業創新夥伴計劃》;5月30日,印發《北京市促進通用人工智能創新發展的若幹措施》;5月30日,印發《北京市加快建設具有全球影響力的人工智能創新策源地實施方案(2023-2025年)》。
姜廣智也提到,北京市經信局將按季度迭代推出大模型應用成果,形成一批人工智能與經濟社會發展深度融合的典型案例,並正在籌劃通過算力券等形式支持模型夥伴和模型觀察員,首期預計支持不低於4000萬元算力券,補貼到模型夥伴企業。
上海:12個
今年7月8日,在2023世界人工智能大會閉幕式上,《上海市推動人工智能大模型創新發展的若幹措施》公布,並發布了“模”都倡議,成立上海人工智能开源生態產業集群,打造AI“模都”。
圍繞創新能力、創新要素、創新應用、創新環境四大方向,上海將重點打造三項計劃以及五大平台。三項計劃分別爲:大模型創新扶持計劃、智能算力加速計劃、示範應用推進計劃。
不過,與北京的大模型企業數量相比,上海稍微遜色了一籌。據經濟觀察報不完全統計,截至7月13日,上海共有12個大模型,分別是:總部位於上海的MiniMax、復旦大學的MOSS、商湯科技的日日新、達觀數據的曹植、微盟的WAI、星環科技的無涯和求索、樂言科技的樂言、醫療算網的Uni-talk、上海AI實驗室的書生通用大模型體系、虎博科技的TigerBot、智臻智能的小i、蜜度的蜜度文修。
上海大模型的帶頭人,是商湯及復旦大學。今年7月,商湯日日新大模型更新到了2.0版本,還在大模型基礎上推出了小模型。復旦大學的MOSS於今年2月推出,MOSS系統負責人邱錫鵬說,MOSS在中文能力上已超ChatGPT。
雖然大模型數量沒有北京多,不過,在每家大模型公司都離不开的算力、芯片方面,上海處於遙遙領先的位置。
今年上半年,英偉達股價暴漲,原因是他們的GPU可以爲大模型提供算力,由於GPU出貨量有限,市場供不應求。在上海,也分布着一衆國產GPU公司。
閔行區和上海自由貿易試驗區是上海芯片公司重鎮。陳行公路上,坐落着壁仞科技、天數智芯等爲大模型計算提供通用GPU芯片的國產龍頭芯片公司。上海自由貿易試驗區,林立着芯璐科技、日觀芯設、世瞳微電子等從芯片設計到生成的不同節點、不同研發類型的半導體公司。
張江也是上海芯片公司聚集地。今年世界人工智能大會上,張江的芯片公司們集中發布了芯片新品,包括沐曦集成的“曦思N100人工智能推理GPU”、瀚博半導體的“瀚博第二代全功能GPU芯片”、燧原科技的“人工智能雲端訓練芯片邃思2.0”等。
同時,上海外資芯片公司較多,閔行區紫竹科學園區,有着半導體芯片巨頭英特爾的中國區公司,定義了GPU的英偉達,其中國區公司也在上海。
除了大模型之外,上海也是上一波深耕計算機視覺的“AI四小龍”商湯科技、依圖科技的發源地。2019年,上海浦東新區成爲全國第一個人工智能先導區。現在,上海交大、復旦、同濟、上大等13所高校和5個科研院所都設立了人工智能相關學科點。
AI扶持政策上,上海在全國範圍內都跑得很快。去年9月,上海出台了全國首部AI省級法規《上海市促進人工智能產業發展條例》,提到上海市推動算法模型交易流通,上海市經濟信息化部門會同相關部門指導行業組織制定人工智能算法模型推薦目錄,降低算法模型交易風險,提高算法模型交易效率。《條例》指出,上海市支持相關主體开展基於先進架構的高效能智能芯片設計創新,研制雲端芯片和雲端智能服務器,布局類腦芯片,強化軟硬件協同適配,支持聯合建設研發測試和應用平台,加強技術協同和芯片架構互聯互通,提升智能芯片產品和技術競爭力,培育智能芯片應用生態體系。
深圳:11個
在深圳龍崗政數局的行政服務大廳,大模型已應用於政務咨詢服務系統,背後提供支撐的就是雲天勵飛技術股份有限公司名爲“天書”的大模型。這家AI公司今年4月4日登陸科創板,是“深圳人工智能第一股”,目前市值229億元。
深圳另一家做自然語言處理技術的追一科技,今年也發布了其自主研發的大模型“博文Bowen”,落地於金融、政務等垂直場景。
此外,深圳也有大模型科研力量。在深圳福田,前微軟全球執行副總裁、AI及技術研發體系負責人沈向洋掛帥的IDEA研究院,推出了开源通用大模型“姜子牙”系列並开源封神榜第99個通用大模型“姜子牙通用大模型v1”。姜子牙大模型擁有130億參數,可進行千億token量級預訓練。同時,香港中文大學(深圳)和深圳市大數據研究院訓練並开源了一個醫療大模型——HuatuoGPT(華佗GPT),以使語言模型具備像醫生一樣的診斷能力和提供有用信息的能力。
“北京做的是0到1的事情,上海做的是從1到10的事情,深圳則是做從10到100的事情。”一位專注深圳人工智能企業的研究人士這樣形容深圳在AI領域與北京、上海的不同。在他看來,深圳的AI公司擅長的是最上層AI應用,可能還要等半年到1年時間,才是深圳公司大顯身手的時刻。
前不久,上述人士對當地大模型公司做了摸底工作,最新數據是,深圳有11家做大模型的公司和機構,其中既有通用大模型,也有行業大模型。
當然,深圳AI毫無疑問的龍頭公司還是華爲。7月7日下午,華爲發布盤古大模型3.0,並且華爲也提供算力,7月6日,華爲旗下算力解決方案昇騰AI集群全面升級,集群規模從最初的4000卡集群擴展至16000卡,爲業界首個萬卡AI集群。
5月31日,深圳市印發《深圳市加快推動人工智能高質量發展高水平應用行動方案(2023-2024年)》,同步發布首批“城市+AI”應用場景清單,統籌設立規模1000億元的人工智能基金群,以最充足的算力、最大的政策支持、最優的產業生態、最好的人才環境、最豐富的場景應用,打造國家新一代人工智能創新發展試驗區和國家人工智能創新應用先導區。
上述研究人士告訴經濟觀察報,由於大模型創業門檻比較高,需要頂尖人才,偏基礎研究,在大模型發展早期,北京這樣高校多的城市有優勢。深圳制造業發達,將來會強在應用端和產業化。
7月4日,深圳市人工智能產業協會研究團隊發布的《深圳市人工智能產業發展白皮書(2023年度)》顯示,2022年,深圳市人工智能產業規模達2488億元。
其中,深圳市人工智能核心產業規模達308億元,同比增長52.48%;企業數量方面,2022年,深圳市人工智能企業數量達1920家;產業鏈分布方面,2022年,深圳市人工智能基礎層僅佔企業總數量的8.13%,技術層佔企業總數量的17.29%,應用層佔企業總數量的74.58%;區域分布方面,2022年,深圳市人工智能企業主要集中在南山、寶安兩區,合計佔比高達58.1%。其中,南山區數量佔36.8%,寶安區佔21.3%。
杭州:8個
據經濟觀察報不完全統計,杭州的大模型有8個,最大的是阿裏雲的通義大模型家族,此外還有西湖心辰的西湖、宇視科技的梧桐、恆生電子的Light-GPT、螞蟻集團的貞儀、新華三H3C的百業靈犀、實在智能的塔斯、網易伏羲的玉言。
杭州AI龍頭是阿裏巴巴,目前,阿裏雲通義大模型家族已經有3款大模型,包括通義千問、通義聽悟和通義萬相。阿裏巴巴旗下的螞蟻集團也發布了貞儀大模型。
杭州另一股AI力量來自網易。在2023世界人工智能大會上,網易伏羲多款AI大模型產品首次亮相,包括“玉言”、“丹青”等。
浙江西湖邊上,還坐落着一家大模型創業公司西湖心辰,這家公司與西湖大學等科研機構合作,融合了學院派的力量,發布了西湖大模型。今年以來,西湖心辰獲得了百度、湯姆貓的投資,其最新一輪融資發生在7月,完成超億元战略融資。
據IDC與浪潮信息聯合發布的系列《中國人工智能計算力發展評估報告》,近五年,杭州穩居十大算力城市的前三席,與北京、深圳角逐,顯示出強大的競爭力。
在算力載體方面,杭州擁有阿裏雲城市大腦、海康威視視頻感知國家新一代人工智能开放創新平台,以及腦與腦機融合前沿科學中心、人工智能協同創新中心、國家數據智能技術創新中心國家級創新平台。
同時,杭州的科技公司還找到了一個現成的試驗場:電商產業。作爲電子商務之都,頻繁更新的內容生產需要催生了電商對於AIGC的市場需求,這成爲當前AIGC在杭州市場化落地的支柱項目。目前杭州科技企業的AIGC服務已經能實現電商場景的快速搭建,除了營銷文字外,商家所需要的產品介紹,圖片素材都可以通過AIGC自動生成。去年流行一時的AI繪畫,部分新媒體已經在使用的AI內容生成等,杭州企業的相關產品也已推出。
政策方面,去年底杭州發布《2022年杭州市第三批重點建設的人工智能應用場景清單》,涉及智慧城市、智慧制造、智慧醫療、智慧交通、智慧金融等多個領域,共46個重點建設人工智能應用場景入選。今年6月,杭州市經信局起草了《關於加快推進人工智能產業創新發展的實施意見(徵求意見稿)》,現向社會公开徵求意見。
目前之江實驗室、阿裏達摩院、浙江大學等科研院校都在加大對AIGC領域的研究。
廣州:4個
據經濟觀察報不完全統計,廣州有4個大模型,分別是雲從科技的從容、華南理工大學未來技術學院的扁鵲和靈心、數說故事的SocialGPT、賽靈力科技的達爾文。
2021年7月,廣州市科學技術局就發布了《廣州市人工智能產業鏈高質量發展三年行動計劃(2021-2023年)(徵求意見稿)》,提出廣州將重點打造1項具有國際影響力的人工智能創新大賽、建設10個人工智能產業園,打造100個人工智能典型應用場景,培育超1000家人工智能企業。
去年9月,廣州市發布了《廣州市促進創新鏈產業鏈融合發展行動計劃(2022—2025年)》點出六大重點行動。
成都:3個
據不完全統計,成都已發布的大模型有3個:曉多科技與國家超算成都中心聯合發布的曉模型XPT、醫聯科技發布的medGPT、明途科技的workChat數字人。
今年5月,曉模型(XPT)發布,這是基於大語言模型技術开發的面向電商行業的垂類大模型。5月 25日,醫聯發布了國內首款醫療大語言模型——MedGPT,致力於在真實醫療場景中發揮實際診療價值,實現從疾病預防、診斷、治療、康復的全流程智能化診療能力。5月31日,明途科技正式發布明途workChat數字人,功能包含知識問答、AI寫作、知識採集、輔助工具等。
今年5月,《2023年成都市大數據與人工智能(含車載智能控制系統)產業建圈強鏈工作要點》印發,17條細化舉措,給予成都大數據與人工智能(含車載智能控制系統)產業鏈發展“路线圖”。
成都市的目標是,今年力爭培育國家級人工智能專精特新“小巨人”企業5家、上市企業1家、上規企業10家,人工智能產業規模突破700億元。
成都市提出,鼓勵高校、科研機構、龍頭企業聯合算力中心聚焦重點產業領域孵化原創AI大模型,並給予建設方每年最高500萬元的算力成本補貼,降低企業創新成本。每年發放總額不超過1000萬元的算力券,用於支持算力中介服務機構、科技型中小微企業和創客、科研機構、高校等使用國家超算成都中心、成都智算中心算力資源。
南京:3個
身處長三角地區的南京,近年來也在着力發展AI產業。據不完全統計,南京已有3個大模型公司,分別是孩子王公司的KidsGPT、智子引擎的元乘象和硅基智能的炎帝。
孩子王公司的KidsGPT在六一童玩節期間推出,專攻母嬰童垂直領域。炎帝大模型是一個多模態的行業模型,企業可以用來做短視頻生成、直播生成、電影/電視劇生成、甚至數字永生等方面的工作。智子引擎是一家多模態大模型初創企業,已經完成千萬元天使輪融資。該公司背後的核心團隊便是中國人民大學高瓴人工智能學院教授盧志武帶領的課題組,其大模型產品元乘象ChatImg參數約150億。
2022年12月,南京市印發《南京國家人工智能創新應用先導區建設實施方案》,提出到2025年,南京將高標准打造5個人工智能產業園區,爭創1—2個省級以上人工智能產業集群,培育100家人工智能重點企業,省級以上專精特新小巨人企業和單項冠軍企業達到30家,全市人工智能核心產業收入超過500億元。
未來,南京人工智能計算中心將繼續在算力支持之外,爲企業客戶提供易用的服務及產品,着眼數據、算力、算法等人工智能產業發展核心能力,賦能企業,推動人工智能產業上下遊企業在南京聚集。中心計劃於近期完成核心夥伴的模型適配驗證,將爲本地企業孵化行業大語言模型提供強有力的基礎模型支撐,在江蘇打造行業大模型轉商落地標杆示範。
其他:11個
其他發布大模型的城市還有天津、合肥、哈爾濱、沈陽、西安、長沙、綿陽、廈門。
天津已有2個大模型公司:國家超級計算天津中心發布的天河天元模型、慧言科技和天津大學聯合發布的海河·諦聽模型。
在世界人工智能大會期間,國家超算天津中心發布了天河百億級智能計算开放創新平台和國產中文大模型——天河天元。國家超算天津中心搜集整理了網頁數據、各種开源訓練數據、中文小說數據、古文數據、百科數據、新聞數據,以及專業領域的中醫、醫藥、問診、法律等多種數據集,訓練數據集總token數達到350B。
安徽合肥的AI公司代表是科大訊飛。今年5月,科大訊飛發布了星火認知大模型。科大訊飛董事長劉慶峰稱,當前訊飛星火認知大模型在文本生成、知識問答、數學能力三大能力上已超ChatGPT。
在合肥高新區,一個圍繞智能語音和人工智能領域的產業園區也蓬勃發展起來,被稱爲“中國聲谷”。這裏已有1000多家企業入駐,從業人員超過5萬人,形成了千億級的產業集群。
(本文作者:任曉寧 陶思羽 譚玉清)
點擊進入專題: 聚焦AI責任編輯:劉德賓
標題:中國AI產業地圖:誰是“大模型之都”
地址:https://www.utechfun.com/post/238672.html