國家隊入場,爲智算中心再添一把火

2024-03-01 18:40:37    編輯: robot
導讀 日前,國務院國資委召开的AI人工智能專題推進會火爆全網,受到了行業的廣泛關注。 會議要求,中央企業要主動擁抱人工智能帶來的深刻變革,把加快發展新一代人工智能擺在更加突出的位置。會議強調“要夯實發展基...

日前,國務院國資委召开的AI人工智能專題推進會火爆全網,受到了行業的廣泛關注。

會議要求,中央企業要主動擁抱人工智能帶來的深刻變革,把加快發展新一代人工智能擺在更加突出的位置。會議強調“要夯實發展基礎底座,把主要資源集中投入到最需要、最有優勢的領域,加快建設一批智能算力中心”;“強化需求牽引,加快重點行業賦能,構建一批產業多模態優質數據集,打造從基礎設施、算法工具、智能平台到解決方案的大模型賦能產業生態”。

會上有10家中央企業籤訂倡議書,表示將主動向社會开放人工智能應用場景。作爲國民經濟的重要支柱,央企在人工智能領域的布局和發展更是備受關注。央企加速布局人工智能,將爲相關行業帶來新的發展機遇,同時也體現了國家對於人工智能的高度重視和大勢所趨。

隨着全球AI技術的快速發展,智能算力已成爲推動經濟增長和社會進步的關鍵要素。中國作爲全球最大的經濟體之一,正積極應對這一技術變革,加強智能算力的研發和應用,以提升國家競爭力。

在深入了解中國在智算市場的布局之前,先來了解一下什么是“智能算力”?我們日常生活中都有哪些時候會接觸到智能算力?

01

何爲智能算力?

按照《中國算力白皮書(2022年)》的定義,算力主要分爲四部分:通用算力、智能算力、超算算力、邊緣算力。通用算力以CPU芯片輸出的計算能力爲主;智能算力以GPU、FPGA、AI芯片等輸出的人工智能計算能力爲主;超算算力以超級計算機輸出的計算能力爲主;邊緣算力主要是以就近爲用戶提供實時計算能力爲主,是前三種的組合。

單從概念上看似乎覺得有一些遙遠,但實際上,智能算力已經深入到了我們生活的方方面面。倘若說起春節檔電影中的特效、渲染和人臉識別,或者是我們日常使用的智能客服、語音翻譯等應用,這些背後都離不开智能算力的支持。

如果說人工智能是創新的加速器,那么智算中心則可以爲各類技術創新提供支撐。

02

大模型引發算力缺口,中國需要多少智能算力?

2023年衆多大模型產品發布,基於大模型的AIGC技術在文本生成、知識回答、圖像生成、邏輯推理等方面表現出遠超預期的效果,吸引了大量用戶與市場關注。

據不完全統計,截至2023年10月,中國大模型創新主體共254家,分布於20余個省市/地區,其中,北京122家,數量居全國首位。截至2024年1月,備案上线大模型38款,佔全國近一半。百度發布文心一言4.0,用戶規模過億,日均調用量達千萬次;智譜AI研發第四代基座大模型GLM4,开源版全球下載量超1000萬次,是目前开源影響力最高的國產大模型;百川智能發布實現全球最長上下文窗口的大模型Baichuan2,开源版僅四個月全球下載量超600萬次;中科院自動化所發布全球首個千億參數多模態大模型紫東太初2.0。在深度學習框架方面,百度飛槳知名度與使用率均處國內第一梯隊,國內市佔率近36%,截至2023年12月底,已凝聚1070萬开發者,服務23.5萬家企事業單位。

在實際應用中,利用AI技術自動生成內容的生產方式打造的“數字人”效果媲美真人水平;人工智能預測蛋白質結構給基礎研究帶來全新的研究手段;人工智能驅動的聊天機器人能夠學習和理解人類的語言並與人類進行對話;華爲雲开發的“盤古氣象大模型”在預報台風軌跡和登陸時間方面大顯身手……

看得見的AIGC蓬勃發展背後,是看不見的智能算力在支撐。大模型爆發掀起了新一輪AI熱潮,也改變了智能算力需求與格局。

工業和信息化部、中央網信辦、教育部、國家衛生健康委、中國人民銀行、國務院國資委等六部門聯合印發的《算力基礎設施高質量發展行動計劃》提出到2025年,中國算力規模超過300EFLOPS,智能算力佔比達到35%。

說到這裏可能會有人發問:FLOPS是什么?300EFLOPS是什么水平?

FLOPS是算力的單位,衡量算力資源每秒進行浮點運算的次數,是Floating-point operations per second的英文縮寫。它常被用來估算電腦的執行效能,尤其是在使用到大量浮點運算的科學計算領域中,比如機器視覺相關圖像處理的訓練與推理。

FLOPS前面加上字母表示更大的算力單位:

一個MFLOPS(megaFLOPS)等於每秒一百萬(=10^6)次的浮點運算。

一個GFLOPS(gigaFLOPS)等於每秒十億(=10^9)次的浮點運算。

一個TFLOPS(teraFLOPS)等於每秒一萬億(=10^12)次的浮點運算。

一個PFLOPS(petaFLOPS)等於每秒一千萬億(=10^15)次的浮點運算。

一個EFLOPS(exaFLOPS)等於每秒一百億億(=10^18)次的浮點運算。

下面舉幾個例子方便了解:通過大量數據樣本進行人工智能模型訓練時,根據數據規模、檢測效果、模型類別的不同,訓練一次的算力需求大概爲2-19PFLOS不等;在人臉、語言識別的推理過程中,根據識別精度、並發數量等的不同,對算力的需求跨度可能從10GFLOPS-64TFLOPS,智能駕駛爲完成環境感知、決策避障、自車定位等功能時的算力需求大概爲8TFLOPS。

截至2023年6月底,全國在用數據中心機架總規模超過760萬標准機架,算力總規模達到197EFLOPS,位居全球第二。

在大模型需求驅動下,智算中心項目如雨後春筍般湧現。

03

30余座城市搶建智算中心

隨着下遊算力需求的集中爆發和“東數西算”的推進,各級政府、運營商、互聯網企業紛紛开啓智算中心建設計劃。據國家信息中心與相關部門聯合發布的《智能計算中心創新發展指南》顯示,目前全國正在建設或提出建設智算中心的城市已經超過30個,經典案例包括京津冀大數據智算中心、長沙5A級智能計算中心等。

智算中心建設的企業主體則包括三大電信運營商和部分互聯網企業。運營商推動建設的智算中心具有一定公共服務屬性,成爲政府主導的算力基礎設施建設的良好補充。以百度、阿裏、騰訊爲代表的互聯網企業也紛紛建設智算中心,以推動自身業務發展、更好地推動客戶人工智能場景落地。

前瞻結合至頂智庫統計,截至2023年8月,中國已投入運營和在建的智算中心分布在北京、上海、南京、杭州等多個城市。從區域分布來看,中國智算中心集中於東部地區和中部地區。其中,東部地區智算中心數量達25個,佔比62.5%,排名第一,以京津冀和長三角地區爲主;中部地區佔比17.5%,排名第二;西部和東北地區的智算中心數量佔比分別爲12.5%和7.5%。

值得注意的是,北京是發力智算中心的主要地區之一。北京在海澱、朝陽、經开區、石景山、門頭溝、大興、豐台等區均布局智算中心,目前已建成智能算力總規模約5000P。

近日,石景山區北重科技文化產業園的四跨廠房已开啓火熱的改造施工,建成後初期將具備610P的算力,相當於30萬台高性能電腦的計算能力,可供一個人工智能大模型在30秒內完成對近1000萬張圖片的學習和識別,預計今年10月即可建成投用。

剛剛开年就動作頻頻

新年伊始,各大運營商便積極行動起來,紛紛加強在智能計算中心領域的布局。

1月8日,中國移動智算中心(武漢)在武漢未來科技城开放運營,已建成1500PFLOPS服務能力,到今年底計劃擴容至6800PFLOPS,成爲華中地區規模最大的智算中心。

1月22日,上海電信在上海點亮“大規模算力集群暨人工智能公共算力服務平台”,計劃2024上半年在上海規劃建設到達15000卡,總算力超4500P,其中單池新建國產算力達萬卡,預計成爲國內首個超大規模國產算力液冷集群。

1月30日,中國聯通人工智能創新中心成立儀式在京舉行。值得注意的是,2023年11月24日中國聯通長三角(蕪湖)智算中心項目才正式开工。

可以看到電信、移動、聯通三大電信運營商正在聚力“東數西算”數據中心集群建設,全力推進各自相關項目,加快打造全國算力中心城市和智算中心,促進數字經濟與實體經濟深度融合。

04

AI服務器是智算中心建設中最關鍵的設備

AI服務器是智算中心建設中投入比重最大、最爲關鍵的設備。

據市場研究機構IDC的最新報告顯示,從2022上半年到2023年上半年,中國AI服務器市場規模成長了54%,其中GPU服務器依然是主導地位,佔據92%的市場份額,達到30億美元。同時NPU、ASIC 和 FPGA等非GPU加速服務器以同比17%的增速佔有了8%的市場份額,達到2億美元。

2023年上半年,從廠商銷售額角度看,浪潮、新華三、寧暢位居前三,佔據了70%以上的市場份額;從服務器出貨台數角度看,浪潮、坤前、寧暢位居前三名,佔有近60%的市場份額。

AI服務器依賴高性能芯片供給。中國市場面臨的算力缺口給國內的芯片發展帶來新的機遇。中國本土的AI芯片廠商發展正處於快速增長的階段並取得了顯著的成就,吸引了大量的投資和關注。這些企業在AI芯片設計、算法優化、生產制造等方面具備了一定的實力和競爭優勢。此外,中國政府的政策支持也起到了重要的推動作用。2023年上半年,中國加速芯片的市場規模超過50萬張。從技術角度看,GPU卡佔有90%的市場份額;從品牌角度看,中國本土AI芯片品牌出貨超過5萬張,佔比整個市場10%左右的份額。

從國產AI服務器所需的AI加速芯片的供應商來看,目前國內阿裏巴巴(含光系列)、百度(昆侖系列)、華爲(昇騰系列)等雲服務提供商都有自研的雲端AI加速芯片。還有寒武紀(思元系列)、海光信息(深算系列)、燧原科技、天數智芯、壁仞科技、摩爾线程、沐曦等。此外,景嘉微、龍芯中科等也在研發雲端AI加速芯片。

從2023年上半年的數據來看,中國AI服務器芯片國產化率較去年出現了下降,比例從去年的15%左右下降到10%左右。這主要是因爲高端訓練服務器的需求大幅增長,而國產芯片性能難以跟上。

爲了進一步提升國產AI服務器的性能,不僅需要芯片廠商在技術上持續創新,提高芯片的性能和穩定性,還需要這些芯片廠商深入了解市場需求,开發出更符合實際應用場景的芯片產品。同時,政府、企業和研究機構也應加大投入,支持國產芯片產業的發展,爲其提供更多的研發資源和市場機會。

05

如何讓智算中心真正用起來?

智算中心建成後,如何令其在運營過程中發揮更大的作用,依舊是一個非常關鍵的問題。

當下智算中心已逐漸賦能區域產業集群發展,但值得注意的是,其在多元算力融合、上下遊協同、建設應用聯動、能源消耗、使用價格等方面仍面臨諸多挑战。

比如:通用算力和專用算力還有待融合。在自動駕駛、智慧醫療、智慧城市等不同場景中,算力需求不同。單一化算力方案難以滿足多元算力需求,不能兼顧多產業和多領域。

算力、算法和數據協同不足。這些年來建設的智算中心,不同的芯片平台、算法模型、數據庫、應用層面部分處於垂直一體化“孤島”狀態,軟硬件兼容性問題有待改進。

投資建設運營有待聯動。智算中心投資、建設和運營往往由不同主體負責。前期建設單位往往對建設後運營的模式、服務標准投入不足,出現了管頭不管尾、建設運營割裂的現象,影響客戶體驗。

碳排放和能耗高。設備自身的能耗排放帶來非常大的挑战,比如OpenAI公司的超大規模預訓練模型GPT-3訓練所需的耗電量爲19萬千瓦時,相當於2021年人均用電量的228倍。

投資成本和應用價格待規範。智算中心的投建成本較高,部分智算中心每 100P半精算力的投資成本高達5億-6億元,遠遠高出正常市場價格,同時使用成本也較高,比如據保守估計GPT-3大模型訓練費用超過1200萬美元。

智算中心建設需要結合建設基礎、當地或區域產業特色,分類引導施策,改建並行,發展與數字經濟相適應的智算中心;還需要選擇合理的建設和運營模式,實現長效運營、促進有序布局,保證智算中心所釋放的經濟社會效益最大化。

如今中國智算中心產業發展正在克服1.0時代的挑战進入2.0時代,中國在智算中心的建設中,始終堅持以算力融合、軟硬協同、建運一體、能耗低碳、成本優化、需求牽引、安全可信爲基礎,穩步推進智算中心的發展。

       原文標題 : 國家隊入場,爲智算中心再添一把火



標題:國家隊入場,爲智算中心再添一把火

地址:https://www.utechfun.com/post/339491.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡