劍指英偉達,硅谷大廠發力自研AI芯片

2023-11-17 18:40:09    編輯: robot
導讀 黃仁勳還坐得住嗎? 美國當地時間11月15日,微軟Ignite技術大會在西雅圖揭幕。  集團CEO納德拉帶來了長達一個小時的揭幕演講,介紹微軟在ESG、新一代空芯光纖、Azure Boost數據中心...

黃仁勳還坐得住嗎?

美國當地時間11月15日,微軟Ignite技術大會在西雅圖揭幕。 

集團CEO納德拉帶來了長達一個小時的揭幕演講,介紹微軟在ESG、新一代空芯光纖、Azure Boost數據中心等項目的新動態。而整場演講的重頭戲,非AI莫屬——尤其是首款自研AI芯片Azure Maia 100的亮相,成爲場內場外無數聚光燈下的焦點。 

微軟重視AI人所共知,發力自研芯片也不是什么祕密。Maia 100的亮相,則是微軟的第一張階段性答卷,向外界表明自己的野心與實力。 

有趣的是,英偉達CEO黃仁勳也來到現場,爲Azure和英偉達合作的AI foundry service站台。納德拉當着黃仁勳的面發布自研AI芯片,難免讓人浮想聯翩。 

英偉達對高算力芯片的壟斷,早已成爲硅谷衆大廠的心病。它們一方面離不开英偉達,另一方面又不想永遠被英偉達掣肘。當自研芯片成爲潮流,微軟、Meta、谷歌、亞馬遜先後亮出壓箱底的寶貝,誰能真正掙脫枷鎖? 

(圖片來自Pixabay)

微軟首款AI芯片來襲,Maia 100成色幾何? 

首款芯片的命名從此前盛傳的Athena改成Maia,靈感大概是參考了NGC 2336星系。Maia可以譯爲“明亮的藍色恆星”,根據NASA的觀測,NGC 2336星系近似螺旋形態,直徑約20萬光年,也以旋臂中的藍色恆星聞名。以此命名自己的首顆AI芯片,微軟或許是想以深邃的太空借喻充滿想象力的AI世界,以及對算力的高追求。 

Maia 100的亮相也不算突然,早在10月初就有媒體劇透微軟將在开發者大會上發布首款自研AI芯片,並將向Azure雲客戶供應。不過微軟對自研芯片計劃的保密工作做得很好,直到正式發布後,外界才能真正了解其設計、算力和應用場景等詳細情況。 

根據納德拉的介紹,Maia 100是一款AI加速芯片,基於Arm架構設計,主要用於雲端訓練、推理以及Azure的高負載雲端運算。不過納德拉否認了將向雲計算客戶供貨的傳聞,這款自研芯片將優先滿足微軟自身的需求,並在合適的時機向合作夥伴和客戶开放。 

Azure芯片部門負責人、微軟副總裁拉尼·博卡爾則補充道,Maia 100已經在Bing和office的人工智能套件上測試。合作夥伴openAI也开始使用這款芯片進行測試部分產品和功能,比如GPT 3.5 Turbo。 

(圖片來自Azure官網) 

至於測試的效果如何,微軟暫時還沒有給出具體報告。但納德拉和博卡爾強調Maia 100可以加快數據處理速度,尤其是在語音和圖像識別方面。 

提速的關鍵,自然是算力。爲了提升算力,微軟也是下了血本:採用台積電的5nm制程工藝,晶體管數量達到1050億個。和今年4月被曝光的信息相比,Maia的制程工藝、設計架構都沒有太多出入,性能表現或許還需在應用數據來檢驗。 

不過橫向對比的話,Maia 100和英偉達、AMD等大廠的產品在參數上還有很大差距。AMD在今年發布的專用於AI加速的MI 300X芯片晶體管數量達到1530億,更不用說算力超強的英偉達了。 

以最近發布的H200爲例,GPU核心和H100相同,但CUDA核數達到16896個,加速頻率1.83GHz,顯存具備更大的容量和更高帶寬,可以支持超大參數的大模型訓練與推理。官方給出的參數顯示,H200相較上一代產品在Llama2和ChatGPT的訓練速度分別能提升40%和60%。 

可以看出,從MI 300X到H200,再到Maia 100,大廠對訓練參數量、訓練速度和芯片算力的追求是沒有上限的。大模型的迭代速度也在加快,只因各家大廠都想跑得比對手更快一步。 

芯片是這場算力競賽裏最關鍵的一環,沒有人想在這上面掉鏈子。而爲了擺脫對英偉達的依賴,自研就是最好的出路。

 當自研AI芯片成爲必選項 

英偉達的芯片不是不好,反倒是太好了,好到直接滋生了兩個難以解決的問題:一是供不應求,二是價格高不可攀。 

英偉達沒有正面回應H100和A100兩款最熱門產品的產能和需求,但據外媒報道,今年內H100加速卡的產能至少同比增長了3倍,且仍有許多產能瓶頸無法解決。比如台積電5nm生產线產能,英偉達的GPU必須使用台積電的CoWoS封裝技術,市面上完全找不到別的替代品。 

供不應求,市場槓杆就會自動生效,調高價格、篩選客戶。從去年下半年开始,搶購GPU就成爲硅谷大廠最重要的任務之一。大廠爲了搶時間、保供應,囤的貨一個比一個多,階段產能愈發喫緊,繼而再次推高價格,形成一個死循環。 

微軟在2019年投資openAI後算過一筆账,爲了支撐歷代ChatGPT的訓練,微軟每年光是採購A100的資金就在數億美元以上。而稍晚啓動的自研芯片計劃,每年开銷只需1億美元左右。白紙黑字擺在面前,大廠也不傻。本就有一定技術,也有足夠流動資金的微軟、谷歌、亞馬遜、Meta們,紛紛加速擁抱自研芯片。 

這當中,谷歌和亞馬遜是起步最早、成績也最突出的。單論研發實力,微軟甚至夠不着硅谷的第一梯隊。 

得益於在手機領域的長期布局,谷歌積累了大量芯片技術,除了美國本土之外,還在印度設置了大規模的芯片研發中心。2021年推出的自研芯片Tensor使用三星5nm先進制程,GPU性能較上一代產品大幅提升370%,狠狠秀了一把肌肉。 

這幾年,谷歌從高通、蘋果、英偉達、博通挖來大量人才。最新消息顯示,谷歌計劃在2027年將博通剔除出AI芯片供應商的行列,每年將節省數十億美元的採購費用。而對標博通的TPU,就成爲了谷歌AI芯片計劃的重點發力方向。 

事實上,谷歌的TPU自研計劃也是由來已久。2021年,時任谷歌研究部門主管Cliff Young就透露,谷歌有長期的計劃,會在數據中心部署大量自研TPU,以加強雲端運算速度,未來不排除將對外出售。 

亞馬遜也是自研芯片的老玩家,其強大在於,建立了完整的自研芯片產業鏈,形成網絡芯片、服務器芯片、AI芯片三條產品线。在AI 芯片領域,亞馬遜的自研產品就通用計算芯片、機器學習訓練芯片、學習推理芯片等。 

滿打滿算,從2013年推出首款自研芯片Nitro 1以來,亞馬遜已經推出了超過10款自研芯片,無論數量還是覆蓋的領域,都遠超其他硅谷大廠。AWS在2020年便發布了用於訓練大模型的自研芯片Trainium,也是最早發力AI專用芯片的大廠之一,爲AWS徵服全球立下汗馬功勞。 

就連落後一截的Meta,也在今年高調提出造芯計劃,推出定制芯片MTIA v1,並牽手高通、重組研發團隊。爲了奪回主動權、節省开銷,大廠肯定會拼盡全力。接下來,不知道英偉達將如何接招?

取代英偉達談何容易,在博弈中合作將成爲主題 

硅谷大廠的反抗之心,黃仁勳當然了然於胸。與其說英偉達對微軟、亞馬遜、谷歌們的進攻無動於衷,倒不如說是有恃無恐——硅谷大廠的自研芯片算力遠不比上英偉達,也缺乏配套的AI軟硬件。想自供自給乃至取英偉達而代之,在現階段並不現實。 

算力上的差距前文已有介紹,此處不再贅述。在芯片算力之外,英偉達還強在擁有Base Command(AI訓練端到端軟件服務)、AI Enterprise(提供平台支持的企業級軟件)等大量配套設施。 

(圖片來自英偉達官網) 

微軟等大廠自研AI芯片,是爲了降低採購成本。但大模型從訓練到落地應用,需要的絕不止一顆芯片。當參數級別變得原來越高,开源程度不斷提升,需要使用的配套軟硬件也會越來越多,這時候大廠們就不得不重新算一下自己的账本了。 

高調發布自研芯片的微軟,就很清楚自己短時間內離不开英偉達和AMD。納德拉之所以請黃仁勳到場助陣當然不是爲了示威,而是示好。展望未來,大廠之間的暗中角力當然少不了,但合作還是主旋律。 

黃仁勳出席微軟Ignite全球技術大會,是爲了宣傳針對英偉達H100設計的NC H100 v5虛擬機,這是一項類似於AI代工的服務,可以幫助Azure的客戶和合作企業开發大語言模型。此外,微軟Azure仍在使用AMD的 MI300X加速虛擬機和最新的GPU提高AI模型訓練和推理速度。 

值得一提的是,微軟在15日的技術大會上還宣布推出MaaS模型即服務,向用戶开放API接口,以便在雲端部署自己的开源大模型。Meta等大廠據悉也將加入开源行列,Llama 2等知名大模型都會在英偉達的算力支撐下,陸續向第三方开放調用。 

納德拉和黃仁勳心底盤算什么,外人看不見,也猜不透。但至少在明面上,兩人會繼續維持良好的合作關系,有錢一起賺。真正感到壓力山大的,其實是那些艱難求存的初創企業——畢竟大部分芯片企業都要依賴投資人和大廠的資金搞研發,大廠發力自研後必然會削減外部投資,甚至還會擠壓前者的生存空間。 

從2020年的Wave Computing开始,這幾年時不時有AI芯片獨角獸裁員、賣身甚至直接倒閉。不久歐倩,英國GPU芯片公司Imagination也被爆將進行裁員,比例在20%左右。

Wave Computing也算得上紅極一時,當初曾聲稱要追趕英偉達,自家的DPU產品在加速神經網絡的訓練速度上要超過英偉達的GPU1000倍,基於DataFlow架構設計的產品也算得上特立獨行。 

不過之後的故事大家都清楚了,Wave Computing的DPU在某些參數上確實超過了英偉達的GPU,但不具備推廣意義。因爲前者缺乏通用計算架構,也無法針對不同應用場景進行定制化改造,更沒有足夠數量的开發者。在燒光了投資人的資金後,最終只能走向破產清算的地步。 

無獨有偶,openAI在日前悄悄更新,也讓部分AI初創企業感到“末日將至”,更有外媒表示openAI“正在殺死生成式人工智能初創公司”。由此可以看出,做AI大模型和做AI芯片的公司生存壓力巨大,研發難度和高企的經營成本隨時都可能將它們壓垮。 

大公司和初創企業之間的矛盾由來已久,大廠發力自研AI芯片只不過是一劑催化劑。想在巨頭的夾縫謀得一絲生存空間,初創企業要拿出更多真本事。

    來源:雷科技

           原文標題 : 劍指英偉達,硅谷大廠發力自研AI芯片



    標題:劍指英偉達,硅谷大廠發力自研AI芯片

    地址:https://www.utechfun.com/post/292632.html

    鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

    猜你喜歡