北電數智:先讓國產芯片被用起來

2024-05-27 18:10:56    編輯: robot
導讀 北京朝陽區酒仙橋中路18號北廣科技園內,有一片被綠幕圍起來的施工地,佔地1.7萬平方米,地上建築規模爲3.5萬平方米。今年底,這裏將建成一座能給人工智能(AI)企業提供公共算力的智算中心。 智算中心...

北京朝陽區酒仙橋中路18號北廣科技園內,有一片被綠幕圍起來的施工地,佔地1.7萬平方米,地上建築規模爲3.5萬平方米。今年底,這裏將建成一座能給人工智能(AI)企業提供公共算力的智算中心。

智算中心在當下並不新鮮,自從2022年AI聊天機器人ChatGPT爆火後,全國各地搶建智算中心。研究人員一度對此感到擔憂,害怕一窩蜂建設會造成爛尾現象。

北京這座智算中心的特殊之處在於,它不是單純地建設算力倉庫,堆疊硬件機器,而是在軟件、硬件和場域層面都做了布局。同時,負責智算中心規劃設計與建設運營的北京電子數智科技有限責任公司(下稱“北電數智”),在北京市經信局的牽引下,還專心研究混元適配技術,以異構算力爲基礎,把性能各異、規格不同的國產芯片統一納管,給用戶提供算力。這項工作的目的,是推動當前市場佔有率較低的國產芯片被使用起來。

北京這座智算中心全名北京數字經濟算力中心(Artificial Inteligence Data Ceter, 下 稱“AIDC”),是北京市級人工智能算力中心項目,落成達產後能夠提供2000P(1P約等於每秒1000萬億次計算速度)算力供給。

作爲北京電子控股有限責任公司(下稱“北京電控”)的旗下公司,北電數智還有專門團隊負責設計一站式的AI應用开發服務解決方案,該方案可以讓沒有开發能力的中小公司簡單、快速地使用AI服務。

北電數智董事長荊磊給經濟觀察報打了個比方,他們其實就是在打造一座AI工廠,從芯片、模型、數據到應用,輸出全棧的AI服務能力。

目前,來自摩爾线程、寒武紀等芯片公司的首批產品已在北電數智完成初期部署,後續所有國產主流芯片公司的產品也將陸續進入評測適配。荊磊說,做國產芯片混元適配具有極高战略意義,但沒有終極商業價值,“它爲了解決眼前的現實問題”。如果把它當作一個商業模式,這個商業模式非常窄。但是爲了促進國產算力發展,必須有人去做這件事。

必須做的事

在一個家具都是二手的破舊房間內,荊磊、北電數智總經理闞冬以及幾位核心人員开始籌備早期團隊。與此同時,他們與AI行業內最知名的機構、頂級的科研人員碰撞討論,由此开啓創業之路。“雖然環境很破舊,但我們沒有感覺到絲毫寒磣,因爲我們知道自己在幹什么事。”荊磊說,北電數智非常有可能成爲AI時代的鏈主企業,以提供算力爲源頭,與國產芯片公司、數據庫公司、大模型公司、AI應用公司合作,真正解決國內在AI時代面臨的發展困境。

在那間辦公室內,北電數智制定了早期策略。今年3月,北電數智AIDC在酒仙橋正式破土動工。此前,創始團隊用了6個月的時間確定設計方案與運營方向。他們認爲,在AI行業一日千裏、瞬息萬變的大變局下,雖然邊想邊幹、邊調整邊優化是基本打法,但認知是第一生產力,在設計環節需要追求極致,研究清楚後再做事。

北電數智的運營方向有三個,包括算力層、模型層與數據層,即以AI工廠的理念要求做規模化智算中心,用生態的辦法做落地的AI解決方案,面向未來做能支撐高質量數據運營的可信數據空間。

三個方向直接指向當前國內AI行業面臨的三個困境:算力供給不足、應用場景落地難、高質量數據开發度低。

在算力層,北電數智的標杆項目AIDC和先進計算迭代驗證平台在今年4月的中關村論壇上首次亮相,這證明了它的智算中心規劃設計與運營能力以及多元異構算力調度能力。在模型層,北電數智利用算力及數據優勢,廣泛嫁接適配底座大模型。同時,它通過自研及聯合多方夥伴共研行業大模型,鏈接生態夥伴700多家,覆蓋AI藥物研發、人形機器人、無人駕駛等領域,通過AI行業解決方案的合作共創,推動政務、醫療和制造等AI應用場景落地。在數據層,北電數智目前正在探索可信數據空間,以多種技術手段打造讓數據安全共享、可信流通的基礎設施。荊磊稱:“我們的肉還沒完全長出來,但是骨架已經出來了。”

荊磊認爲,從成立之初到現在的整體發展來看,北電數智期中考試考得不錯。到年底AIDC落成之時,北電數智將迎來期末考試。如果期末考試通過,後面就將奠定一個非常好的基礎。

去年9月至今,北電數智的團隊從幾個人發展到幾十人,目前還在繼續擴大。它的新辦公區能容納300人,現在很多座位還是空的,但會議室卻總是爆滿狀態。未來它將迎來更多新員工。“AI一日,人間一年。”荊磊這樣形容進入AI行業9個月的感受。他會感覺到興奮,因爲這是一個完全沒有過的體驗,也會感受到壓力,因爲AI的變化太快,此刻認知的東西很有可能在一周之後就被顛覆。但荊磊並不焦慮,因爲他認可這件事的終局價值。“當你把一件事想得特別清楚,知道你具體的方向在哪兒的時候,就不會那么焦慮了。”

用技術解困

AI是當前大國博弈的核心主战場,其中的關鍵是芯片。與國際先進企業的全能芯片相比,國產算力芯片更像單項選手,只在專項場景應用方面具備不錯的性能表現。

因此,北電數智通過納管國產芯片,形成混元算力集群,通過包括硬件層編譯優化、中間層分布式優化及模型層優化在內的三重優化,對相對落後的芯片進行性能調優,讓國產芯片變得可用。

北電數智的技術邏輯是,把專項可用的國產芯片放進同一個“包裹”,並通過軟件加速、算子庫補齊、網絡和通信等方面的工作,實現國產芯片的性能加速和調優,由此湊成一個接近全能的選手,對外提供智能算力。目前,北電數智能把國產芯片的性能從30分—80分調整到70分—90分,即調整到有用戶愿意买單的程度。

這套異構算力技術難度很大,並不是一項成熟的技術。等到國產芯片性能提升到足夠程度時,這套技術或許就已派不上用場。因此,很多企業不愿意做這件事。

荊磊也提到,這件事本身具有極高战略意義,但沒有終極商業價值,“它爲了解決眼前的現實問題”。如果把它當作一個商業模式,這個商業模式非常窄。

但他認爲,這是一件必須做的事,對芯片來說,有機會被使用最重要。北電數智當下所做的事情,就是先讓國產芯片被用起來,同時從場景使用出發,檢驗國產芯片的性能和查找不足,反饋給研發企業,帶動算力技術迭代升級,推動國產芯片從可用到好用。

北電數智做這件事,離不开母公司北京電控的支持,這與產業報國及技術情懷有關。作爲“一五”時期國家重點投資、集中建設的全國重要電子工業基地,北京朝陽酒仙橋地區曾創下多個“第一”,爲我國電子工業、國民經濟發展及國防建設事業作出巨大貢獻,被稱爲“新中國電子工業搖籃”。北京電控所屬部分重點企業,曾在酒仙橋這片土地上研制出了新中國的第一只真空管、第一塊集成電路、第一部程控交換機、第一台電子計算機。

進入21世紀,北京電控又培育出顯示領域領軍企業京東方、集成電路裝備企業北方華創,以及一批具有行業影響力的產業企業。隨着AI時代全面开啓,北電數智應運而生。

北電數智目前已經集聚了一批芯片、網絡、算法、數據等領域的高水平核心技術人員,也聘請了世界頂級的AI專家擔任首席科學家。

荊磊有一種很強的緊迫感。隨着“百模大战”在今年退潮,AI行業對算力的需求沒有之前那么緊缺了。但AI發展速度太快,一旦又有了突破,誕生超級應用,或將推動AI真正在千行百業落地,AI算力將會更緊缺。

他想做很多事,但目前最重要的,還是先把北電數智AIDC建設完成。荊磊很確信,未來AI算力一定仍是短缺的,如果能把國產芯片都用起來,把供應鏈建設完備,將會緩解這個產業難題。

碗裏、鍋裏和田裏

既然要面向市場,北電數智當然不會只做“不掙錢的生意”。

爲此,北電數智結合自身的模型和數據能力,建立了解決方案團隊,爲客戶提供從底層算力、模型开發調優、AI工程化等全棧AI能力。荊磊表示,AI產業需要通過這個環節完成整個產業鏈跟社會的價值交換,才能理順產業鏈與價值鏈的關系,實現產業落地和健康發展。國內發展AI產業的優勢是可以做的場景多,且容易集中力量。解決方案做起來非常難,北電數智要用生態的方法來做。

在他看來,這一輪AI時代的創業者大多比較年輕,在管理、商業經營和項目獲取方面的能力還有待提高,但這些創業者就像一塊塊“璞玉”,本身的技術能力並不弱,和北電數智進行生態合作可以發揮各自優勢。此外,由於北電數智在產業鏈上的前瞻布局與綜合優勢,有不少大模型企業也向北電數智表達了合作的意愿。

截至目前,北電數智已有AI產業生態夥伴700多家,其中芯片合作夥伴12家,服務器合作夥伴3家,數據中心(IDC)合作夥伴2家,AI大模型及工程化合作夥伴33家,政務及公共服務合作夥伴86家,先進制造合作夥伴108家,大交通合作夥伴112家,大健康合作夥伴140家,教育合作夥伴103家,影視傳媒合作夥伴99家。

除了算力、算法,AI三要素還包括數據。隨着數據這一新型生產要素越發受到關注,北電數智在構建AI工廠的基礎上,還把建設AI的可信數據空間這一數據基礎設施的業務也加入到了計劃中。

荊磊說,不管是在產業發展、國家安全還是在地方政府良性運轉方面,數據的價值都非常高,再怎么強調都不爲過。從AI產業發展的角度來講,數據就是這個產業的中軸和終局。

難點在於,一些公共數據、核心產業鏈企業的數據和互聯網企業的數據都難以公开,數據流動和使用過程中也涉及數據安全隱私、區塊鏈、數據溯源等問題。

北電數智有天然的使命擔當與產業組織優勢,它也在數據方面做了完備的人才和項目布局。按照荊磊的比喻,AI工廠、AI場景和AI可信三塊業務分別是北電數智碗裏、鍋裏和田裏的業務,由此可見他對未來業務規模的預期。

荊磊認爲,北電數智作爲AI領域創新型國企,接下來面臨的最大考驗就是節奏。“今年我們要確保AI工廠按照設計方案順利落成,並對外提供能力。另外,已經確定的涉及模型、場景、數據的重點項目和人才隊伍建設激勵等重點工作都要落地,在年內完成战略布局,實現战術突破。”

|對話|

經濟觀察報:你投身AI已有9個月,身在其中是一種什么樣的感受?

荊磊:這是一種之前完全沒有的體驗。現在有一個說法叫“AI一天,人間一年”,我的感受也的確是這樣。你當前認知的東西,很有可能因爲一個禮拜以後別人出了一個新的東西,就徹底改變了。

不過我不會感到焦慮,因爲我們看到了終局。當你把一件事想得特別清楚,知道你具體的點落在哪兒的時候,就不會那么焦慮了。我們當前在發展方向、工作重點上都比較清晰,面臨的挑战主要是節奏控制,這也是業內每一個人都在焦慮的問題。這件事的難點在於,當你把資源投下去之後,需求爆發的時點能不能匹配上?進退之間、騰挪之間要做很多工作,這對我來講是一個很大的壓力。有壓力但並不焦慮,因爲我知道我在做什么,這一點很重要。

有一句話叫“終局樂觀、中局謹慎”,大體是這樣。

經濟觀察報:根據你的實踐感受,現在中國與美國之間AI的差距有多大?

荊磊:我們和領先國家的差距還是比較大的,但我們也有自己的獨特發展優勢。

算力方面,國內是“百花齊放、一強多弱”。與世界領先企業相比,從單芯片性能、集群能力表現等方面看,國內企業都有很長的一段路要走。

模型方面,可以用參數量做一個不太嚴謹的簡單類比。已經發布的GPT-4(美國AI研究公司OpenAI旗下的大模型)是1.8萬億的參數量,國內的大模型差一個數量級。

數據層面,從可公开的高質量數據集角度來講,我們也將近差一個數量級。

但技術水平再高,最終也要產業化落地,不能落地就成了空中樓閣。在這個方面,我們國家有自己的獨特優勢。首先是豐富的場景,中國有全世界最完整的工業體系,有全世界最大的互聯網生態體系,這是一個了不得的優勢。第二是集中力量辦大事的機制,通過政府政策引導和鏈主企業組織,國內可以很好地協調各方面創新資源,加快實施核心技術攻關和重點基礎設施建設,加快落地進程。

經濟觀察報:現在AI行業算力是否依然短缺?如果北電數智的智算中心建成使用,是否能徹底解決國內算力短缺的難題?

荊磊:這是一個很復雜的問題,算力的需求主要來自大模型的訓練和推理,目前的需求主要在訓練層面。去年很熱鬧的“百模大战”熱潮开始降溫,算力的供需緊張情況也有所緩解。

但算力需求有長期存在的趨勢,還要看後面的變化。當AI應用場景爆發後,推理需求會爆發,因此未來算力需求一定是短缺的。你可以想象,未來每個人都需要AI服務,大量的數據都需要算力去計算,那是一個海量的需求。我們所做的事,就是在未來各行各業缺乏算力的時候,能盡力填補上算力空白,這件事的核心就是要把國產算力用起來。同時,我們也在加快構建供應鏈能力。

當然,這裏面還有另一個深層的產業問題,是先進制程問題。AI芯片主要是5納米、7納米的制程,當這個問題解決時,你擔心的國內算力短缺問題才能徹底地解決。相信這個問題在全社會的共同關心和支持下,應該不需要太長的時間,就會有一個比較好的緩解。

海量資訊、精准解讀,盡在新浪財經APP

標題:北電數智:先讓國產芯片被用起來

地址:https://www.utechfun.com/post/375938.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡