當挖坑公司搖身變爲“雲計算網紅”,雲生意正在經歷怎樣的革命?

2023-08-31 18:40:11    編輯: robot
導讀 “雲海礦山”,沒想到“雲和礦“終於走到了會師的那一天。 7月12日,北美上市礦企Hive Blockchain宣布改名爲HIVE Digital Technologies,未來將關注提供人工智能(A...

“雲海礦山”,沒想到“雲和礦“終於走到了會師的那一天。

7月12日,北美上市礦企Hive Blockchain宣布改名爲HIVE Digital Technologies,未來將關注提供人工智能(AI)算力服務。

而CoreWeave,美國的一家針對以太坊的加密貨幣挖礦公司,卻在今年成爲了勢頭正紅的GPU加速雲服務商。

挖礦企業集體向雲市場开拔,雲生意正在迎來一場怎樣的革命?

誰擁有GPU,誰就可以做雲?

挖礦企業一鍵換殼成“雲服務商”,背後是數萬個GPU給的底氣。

挖礦起家,CoreWeave的神奇蛻變源於2018年/2019年的那個加密寒冬,不少挖礦企業倒閉,他們趁着這個機會不斷抄底顯卡,數百張變成數萬張,數據中心增加到了七個,在這期間,他們一方面嘗試爲其加密礦工提供GPU雲服務器,另一方面,一項新的需求正在噴湧而出,大量依賴GPU加速的企業找到他們,希望他們可以提供算力支持。

這個意外的商機,成爲命運齒輪轉動的節點,於是在2019年,CoreWeave开拓了新業務,將GPU雲提供給其他企業开發人員,成爲雲玩家中的一員。

而這場始於挖礦的奇幻漂流,如今卻走向了炙手可熱的舞台C位,今年8月,CoreWeave利用手中的NVIDIA H100作爲抵押,一舉拿下了23億美元的債務融資,約合人民幣165億元,在此之前,CoreWeave 曾融資 4.21 億美元,估值超過 20 億美元,並且與微軟籤署了AI算力協議,將在未來數年內獲得數十億美元來自微軟的投資,用於雲計算基礎設施建設。

不僅估值大漲,隨之而來的還有瘋狂砸過來的訂單和翻倍的收入,在接受VentureBeat採訪時,CoreWeave聯合創始人兼首席战略官Brannin McBee透露,2022年CoreWeave的收入爲3000萬美元,今年將達到5億美元,明年已經籤訂了近20億美元的合同。

而按下這一切加速鍵的是數據中心正在經歷的範式轉變,大模型的狂轟亂鬥,AI高性能計算的崛起讓以加速計算爲代表的下一代計算能力呼之欲出,而GPU也順勢成爲了雲市場新的“硬通貨”。

一直以來,雲服務的本質就是算力服務,將數據中心內的計算資源(如數據庫、服務器存儲器)虛擬化,然後租給市場,而傳統的數據中心基本都是圍繞英特爾、AMD的CPU而建設,CPU主要負責控制和執行指令,可以執行任意程序,相當於整個計算機系統的大腦,而GPU則專爲多任務而生,並發能力強,一系列GPU可以並行使用,與服務器、路由器和數據存儲一起安置在龐大的數據中心中,足以提供傳統計算機所無法企及的計算能力,在AI大行其道的今天,GPU逐漸嶄露頭角,成爲新一代主角。

誰擁有GPU,誰就可以做雲,這似乎成爲了新的“勝利法則”,而英偉達憑借其獨一無二的芯片優勢,正成爲這場範式轉變背後的真正話事人。

北京時間8月24日凌晨,英偉達發布了2024年的第二季度財報,對應時間是2023年5月-7月,其實現營收135.1億美元,熟悉英偉達的人會知道,英偉達的核心業務包括數據中心、遊戲、專業可視化以及車用電子四大板塊,而在此次披露中,其中數據中心業務營收達到103.2億美元,同比增長171%,環比增長141%,營收佔比拉高到76%,增速遠超前一季度,刷新單季最高紀錄。

據英偉達CFO Colette Kress介紹,數據中心收入增長主要得益於雲服務提供商和大型互聯網公司對AI基礎設施的大規模投資。單就國內來看,國內流向英偉達的收入就已達50億美元,今年英偉達將向百度、字節、騰訊和阿裏合計發貨約10萬塊A800芯片,價值10億美元,另外40億美元的芯片將明年交付;其中,字節訂購的明年發貨A800芯片價值約7億美元。

值得注意的是,軟件和服務類收入成爲英偉達新的增長亮點。在第二季財報公布後的電話會上,英偉達表示,目前這塊業務收入穩步提升,已經達到每年數百億美元的規模。未來服務類收入將成爲推動英偉達業績增長的重要組成部分,例如DGX Cloud合作已經獲得成功。

DGX Cloud是今年3月份英偉達在GTC大會上正式發布的GPU雲端服務,將AI專用的GPU放到雲上出租,使得企業無需採購和擁有服務器,便可通過雲服務商合作托管的DGX Cloud基礎設施,取得超算電腦級AI運算功能,以目前的進展速度來看,DGX Cloud正成爲英偉達新的收入大餅。

受益的是英偉達但收益的未必是英偉達

以往,出售算力這種事都是雲計算公司在幹,它們購买多種型號顯卡與人工智能加速器,根據硬件性能或使用時長等方式定價,然後租給下遊客戶。這個過程中,英偉達將GPU要么賣給雲計算平台,要么直接出售給AI公司,比如第一台NVIDIA DGX超級計算機就是在2016年交付給OpenAI的,並沒有直接出售算力。而DGX上雲,雖然英偉達仍需要將其托管到雲平台,但本質上已經是在跨越邊界了。

好端端的芯片公司,爲什么選擇下場做雲?

在電話問答會上,英偉達官方回答了他們推出DGX Cloud的動力:

“首先,我們意識到我們與世界各地的約3萬家公司合作,其中1.5萬家是創業公司,數千家是生成式AI公司。而增長最快的領域當然是AI。我們與全球所有的AI創業公司合作。他們最終希望能夠進入全球任何一個雲,並因此我們在全球領先的雲中建立了DGX Cloud,以便能夠與所有AI合作夥伴同時合作。第二個好處是,它使我們的CSP(雲服務提供商)能與我們更加緊密合作,以改進爲多租戶而設計的超大規模計算中心的性能,這些中心從歷史上設計用於高性能分布式計算,如生成式AI。因此,能夠在架構上密切合作,以提高網絡性能和計算性能,效果非常顯著。第三,當然,NVIDIA本身使用非常大的基礎架構。我們的自動駕駛車隊,我們的深度研究團隊,我們的生成式AI團隊,我們的語言模型團隊,所需基礎架構的數量相當可觀,沒有DGX系統,我們的任何優化編譯器都不可能存在,現在甚至編譯器都需要AI,而且優化軟件和基礎架構軟件的开發也需要AI。衆所周知,我們的工程使用AI來設計芯片,我們內部對AI的消費也非常大,我們的機器人團隊,Omniverse團隊等,都需要AI。所以,我們的內部消費也很大,並將其引入了DGX Cloud。DGX Cloud具有多種用途、多種驅動因素,已經在我們的CSP和开發人員中取得了巨大成功,我們的內部工程師主要是想要更多,這對我們來說是與全球各地的所有AI系統緊密合作的絕佳方式。”

很顯然,無論是基於自身的算力需要,還是爲了擴容和收攏更多的AI創業公司,英偉達都沒有理由不做雲。但恐怕更隱祕的一層原因,英偉達沒有透露的是,英偉達的“搖錢樹”正在被撼動。

的確,本輪AI熱潮的最大受益者當屬英偉達無疑,但收益最多的卻未必是英偉達。

在芯片分銷圈,海外A100和H100的每片價格分別漲到了1.5萬美元和4萬美元,英偉達的中國特供版A800和 H800售價從原來的12萬元人民幣左右,變成了現在的25萬甚至30萬元,甚至有高達50萬元一塊。國內一台配置8顆A100和80G存儲空間的AI服務器,價格也從去年中旬的8萬/台飆升至當前的165萬/台。但這些錢並沒有都流入英偉達的口袋,溢價都被渠道拿走了,關鍵是這種倒买倒賣英偉達還一點辦法沒有。

而這種炒作哄擡下的天價,除了頭部廠商愿意一擲千金外,卻勸退了更多的腰部公司,大多數中小客戶都無力承擔,只能“望GPU興嘆”了。

我們知道,本輪AI熱潮中除OpenAI外,最出圈的AI公司非Midjourney和Authropic莫屬了。前者是一款AI繪圖應用,最近同QQ頻道合作开啓了國內業務,後者的創始人則是出自OpenAI,其對話機器人Claude直接對標ChatGPT。

但這兩家公司都有一個共同點,就是都沒有購买英偉達GPU搭建超算,而是使用Google的算力服務。該服務由一個集成4096塊TPU v4的超算系統提供,爲Google自研。 

值得注意的是,另外一家雲巨頭微軟,也在今年曝光了Athena芯片,傳聞這款名叫Athena的芯片採用5nm先進制程,由台積電代工,研發團隊人數已經接近300人,很明顯,這款芯片目標就是替代昂貴的A100/H100,給OpenAI提供算力引擎。與此同時,亞馬遜的Inferentia和Trainium系列也不甘示弱,可以爲客戶提供從推理到訓練一整套端到端的機器學習計算流程。

雲計算三巨頭都在試圖搶奪英偉達的蛋糕,根據硅谷風投機構A16Z估算的數據,生成式AI所產生總收入的10%~20%最終流向了雲服務商。  

除雲巨頭外,英偉達的大客戶特斯拉也要自己單幹。

2021年8月,馬斯克就向外界展示了用3000塊自家D1芯片搭建的超算Dojo ExaPOD。其中D1芯片由台積電代工,採用7nm工藝,3000塊D1芯片直接讓Dojo成爲全球第五大算力規模的計算機。

渠道對流通溢價的收割,競爭對手的背刺和蠶食,算力供需側的結構性改變,都促使英偉達調轉碼頭,不甘心只做個“賣鏟人”。

以AI爲名的計算革命

世界正在從通用計算向加速計算過渡,這是英偉達在第二季度財報公布後的電話會上得出的一個清晰結論。

在電話會問答環節上,英偉達表示:對於企業來說,提高吞吐量、提高能效、提高成本效益的最佳途徑就是將資本預算轉向加速計算和生成式人工智能。因爲這樣做,你就能從 CPU 上卸載大量工作負載,從而提高數據中心可用 CPU 的數量。你現在看到的公司正在認識到這一轉變的开始,並將其資本投資轉向加速計算和生成式人工智能。這不是一個單一的應用在驅動需求,而是一個新的計算平台,一個正在發生的新的計算轉型。世界各地的數據中心都在對此做出響應,並以廣泛的方式進行轉變。

而這種轉型正在各行各業發生,譬如Meta最近強調,自從推出Reels和AI推薦以來,Instagram的使用時間增加了超過24%,而微軟剛剛宣布的AI合作試點,提高了10億辦公室工作人員和數千萬軟件工程師的生產力。數百萬法律服務、銷售、客戶支持和教育領域的專業人士可以利用受過培訓的AI系統來創造數千億美元的新市場機會。全球最大的營銷和傳播服務機構WPP正在开發一個內容引擎,讓WPP的藝術家和設計師可以將3D內容創作與生成式AI整合在一起,從而讓創意團隊能夠更快速、更高效、更大規模地制作高質量廣告內容。

除此之外,在藥物發現領域,新模型可以減少識別新藥所需的成本和時間,還可以創造更個性化的治療方法。金融領域由人工智能驅動的變革正在改變銀行業、股票交易和保險業。AI可以提高天氣模型的准確性,以改善公共安全,並對農作物產量做出更准確的預測等等,可以預見,一場以AI爲名的計算革命正在席卷而來,計算能力的提高正在賦能整個經濟。

很顯然,面對這種變化,英偉達已經在做准備,而雲是第一步。

算力需求直线狂飆,而價格天塹和渠道割據卻在加劇供需不平衡,英偉達意識到“GPU+雲”才是制勝王牌,用雲的方式把用於AI訓練的GPU價格打下來,以算力平權來籠絡中小企業。

的確,相對來看,DGX雲價格似乎還能接受,配備8個H100 GPU模組的DGX Cloud,每月套餐費只要3.7萬美元,相當於單片H100的價格。

並且這套雲服務還和別家不同,它不僅包括算力,還包括一整套 AI 解決方案。DGX Cloud 集成了Base Command Platform(基礎命令平台)和 AI Enterprise 的兩大配套軟件平台,前者是一個管理與監控軟件,不僅可以用來記錄雲端算力的訓練負載,提供跨雲端和本地算力的整合,還能讓用戶直接從瀏覽器訪問 DGX Cloud。後者則是英偉達 AI 平台中的軟件層,它包含了4000個不同的AI框架,幫助企業开箱即用。除此之外,DGX Cloud 上還提供名爲 AI Foundations 的模型鑄造服務,讓企業用戶可以使用自己的專有數據定制垂直大模型。這套軟硬件組合起來的完整解決方案讓 DGX Cloud 訓練速度相比傳統的雲計算提高了兩到三倍,很好的綜合了英偉達兩方面的強項:AI 生態和算力。這也印證了在今年GTC大會上,黃仁勳所傳達的英偉達要做“AI工廠”的想法,從一家芯片公司轉向提供AI計算系統的公司,是英偉達應對計算範式轉變的布局和战略野心。

DGX Cloud的推出,對於那些急需算力,但資金又捉襟見肘的AI公司來說,無疑給出了一條可行之路,能讓AIGC大模型廠商無需購买英偉達A100顯卡等硬件,而直接按需租用雲算力平台提供的算力,這使得初創企業或非頭部模型廠商也能嘗試進入AIGC領域,同時這些企業也將會成爲由英偉達一手養成的“Cash Cow”。

除此之外,英偉達今年還先後投資了CoreWeave、Lambda Labs兩家美國的中小雲服務商,並且向其傾斜分配稀缺的GPU芯片。據GPU Utils網站預估,CoreWeave向英偉達預定的的H100數量約爲35000-40000張。對比來看,谷歌在今年5月發布的超級計算機A3擁有大約26000個H100,亞馬遜AWS在7月上线的EC2 P5 虛擬機實例基於20000塊H100構建,微軟在8月上线的Azure ND H100v5虛擬機,僅僅包含8塊H100。這么一看,CoreWeave稱自己是全球範圍內唯一一家可以“大規模提供英偉達H100”的雲服務商也並非虛言,英偉達靠對GPU資源的優先級分配,在持續擴大自己的生態陣线。

生成式AI起源於雲端,在通用計算時代,谷歌、微軟、亞馬遜三大雲巨頭,橫行四方,英偉達失去做雲的先機,而在加速計算時代即將來臨的前夜,新的遊戲規則意味着新的賽點,無論是英偉達下場做雲,還是投資入股中小雲服務商,這場雲生意的暗战,或許會讓我們看到下一代數據中心的更迭,以及伴隨而來的全新雲格局的湧現。

       原文標題 : 當挖坑公司搖身變爲“雲計算網紅”,雲生意正在經歷怎樣的革命?



標題:當挖坑公司搖身變爲“雲計算網紅”,雲生意正在經歷怎樣的革命?

地址:https://www.utechfun.com/post/255521.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡