微軟不想被OpenAI架空

2023-08-01 18:10:29    編輯: robot
導讀   文章轉載來源:硅星人   扎克伯格同學最近心情很不錯。   與馬斯克在线激情互噴垃圾話後,對標“元宇宙版推特”的Threads僅用了不到五天的時間完成了1個億用戶的積累,成爲了全球用戶總數破億速...

  文章轉載來源:硅星人

  扎克伯格同學最近心情很不錯。

  與馬斯克在线激情互噴垃圾話後,對標“元宇宙版推特”的Threads僅用了不到五天的時間完成了1個億用戶的積累,成爲了全球用戶總數破億速度最快的新社交平台。Threads,成爲小扎打在馬斯克臉上的一擊力拳。

  但商場的拳台上沒有裁判叫停,扎克伯格說Threads的用戶規模目標是10億。而只有達到10億目標以後,Meta才會認真考慮Threads賺錢的問題。這一數字相當於推特目前規模的兩倍。

  扎克是認真的。無論是反感馬斯克版推特的憤怒用戶,還是Meta帝國多年沉澱下的龐大商業機構關系網,都在極短的時間內湧入了Threads平台。而在無數遊牧遷徙的用戶中,夾雜着一個硅谷最有權勢的光頭——微軟首席執行官薩蒂亞·納德拉(Satya Nadella)。

  納德拉過去是尊貴的推特藍V,擁有307萬的用戶,每天像AI一樣毫無感情地轉推各種微軟的新聞公關稿。不過這次他專門注冊了一個Threads账號,熱情洋溢地宣布了微軟將與Meta的“大模型婚姻”:

  微軟雲Azure將幫Meta訓練和推廣Llama大模型,而Llama也將上线Azure庫和適配Windows系統。

  而如雙方官宣文件所言,Azure從設備、硬件和軟件(facility, hardware and software)層面進行了針對性的設計,從而支持世界領先的AI訓練。而在本次合作後,Llama的开發者則可以利用Azure AI的工具進行訓練、微調、推理和安全方面的功能开發。

  巨頭之間的雲合作屢見不鮮。但全世界都知道,Azure可是OpenAI的御用雲平台。

  在2019年微軟掏出10億美元投資OpenAI後,Azure就一直是OpenAI的獨家雲服務商。而Azure爲了更好地爲大模型提供算力和對外服務,重新進行了部分架構設計。甚至在一些觀察者眼中,當年微軟拍板投資OpenAI的核心原因,其實就是Azure的發展——

  畢竟彼時Transformer還沒有完全驗證,但微軟已經多年下注AI並开始將雲業務的未來愿景視作是“爲AI服務的超級計算設施”。無論是算力支持,還是OpenAI开放全球的chatbot測試,Azure都功不可沒。

  Altman本人甚至還曾經專門發推對Azure團隊的給力支持表示感謝,高度評價微軟是“世界上最好的AI基礎設施”。

  如今Sam前腳剛燒了兩炷香,納德拉轉手就把這個“世界上最好的AI基礎設施”租給了扎克伯格。

  不知道倆人是不是提前商量好的。又或許對納德拉來說,這大概都是計劃的一部分。總之扎克伯格表現得很高興。

  在扎克伯格的Instagram账號裏,他貼出了一張與納德拉的親密合影以“感謝納德拉”,扎克伯格表示:

  “(Meta)將Llama2开源給了微軟,而(這次开源)將成爲下一代大模型建設工作的基礎。”

  微軟與Meta的確是相互需要的。

  Meta正在走向大模型的“深水區”,在70B參數的Llama2已經達到了GPT3.0的水平,幾乎已經成爲了目前口碑最好的大模型底座。對於閉源大模型陣營來說,Llama2成功帶來的壓力一點不亞於Threads對於Twitter的震懾。

  閉源公司花幾千萬搞不出來的東西,开源社區可以直接用,相當於將未來全球开源大模型社區的起跑线提升到了3.0的水平。

  最近登頂HuggingFace开源大模型榜單的Stability的Freewilly大模型,被認爲接近3.5的水平,正是基於Llama2.0調教優化後的產品。

  對於Meta來說,參數規模的提升帶來計算量的攀升、模型的逐步成熟也讓看到更好的商用潛質。但如果要战勝這些困難、落實這些潛力,扎克伯格需要一個更高效的合作夥伴。而那些Azure已經有的、但Meta沒有的東西,對於Llama來說就顯得更重要了,比如Azure的算力經驗、Azure的AI工具箱、以及Azure的雲本身……

  Meta是爲數不多沒有公有雲服務的互聯網巨頭。

  在過去,Meta與亞馬遜都互爲對方的超級大客戶,包括Meta的一些AI研發算力,也都是採購的AWS。而微軟這次撬牆角的方案,除了开放Windows場景以外,還开放了Azure的企業渠道能力,將Llama2加入到自己的產品名錄中。

  Azure雖然在整體市場份額中依然落後AWS,但是在SaaS銷售領域卻顯著領先於同類競爭對手。而隨着雲與SaaS的融合,微軟在渠道層面有顯著的差異化優勢。通過Azure,Meta和它的生態追隨者們可以直接通過雲端來銷售和使用Llama2的產品。

  對於微軟來說,大模型的挑战則更加多元的。

  微軟過去在大模型應用層面幾乎是all in OpenAI的產品。無論是最早接入的Bing,還是基於Windows生態的Copilot\面向开發者的工具生態AI Studio、甚至是新的AI雲服務品牌OpenAI Azure,背後都是OpenAI的影子。

  OpenAI是全球最好的大模型公司,Windows依然是全球最重要的生產力軟件生態。但在大模型全球軍備競賽中,這兩者的結合並不意味着絕對的勝券在握。

  與Meta和微軟結合幾乎同時“官宣”的,則是蘋果的大模型計劃。

  據海外媒體報道,蘋果已經完成了名爲“Ajax”的大預言模型基礎框架,將开發類似ChatGPT的對話式AI。而消費級產品的推出時間則計劃在明年發布。

  蘋果的入場被認爲是硅谷大模型競賽中的重要變量。

  相比於公有雲之類的互聯網風口,AI是被蘋果管理層高度認可的科技方向,近期管理層口風也有朝着AI加碼的趨勢。

  除了長期關注AI科技外,蘋果是全球最有錢、最有場景的公司。蘋果每年淨利潤接近1000億美元、經營淨現金流超過1200億美元,相當於微軟與Meta的總和。蘋果生態已經超過微軟成爲全球最大的封閉操作系統,活躍設備數量超過20億,而微軟只有15億。

  而相比於账面實力外,蘋果更具想象力的是它的半導體能力。它或許是全球參與大模型競賽的科技企業中,爲數不多將來可以不用外採GPU與CPU的廠商。不僅如此,蘋果的芯片效率似乎更有想象力。

  在2023年WWDC上,蘋果推出的M2 Ultra芯片。相比於普通廠商CPU、GPU分離的部署方式,M2 Ultra統一內存架構以及隨之帶來的超高內存帶寬,甚至可以讓开發者在一張卡上就能跑大模型。

  盡管類似的消費級芯片還無法和英偉達的專業芯片相媲美,但類似小秀肌肉,也讓外界對蘋果未來的GPU算力延展能力產生了興趣。

  以OpenAI爲例,外界預估其大概同時動用了兩萬張顯卡進行計算。但王小川近期對媒體表示,OpenAI正在測試1000萬張顯卡同時計算的模型,相當於英偉達目前10年的產能,“完全是登月計劃(級別)”。

  除了蘋果以外,微軟、谷歌、Meta、亞馬遜等巨頭都有自研AI芯片的計劃,但已經有頂尖半導體开發能力的蘋果依然是最有資格“大力出奇跡”的人。

  Apple將兩枚 M2 Max 的芯片連接在一起打造出M2 Ultra

  谷歌兇猛、蘋果虎視眈眈,微軟和Meta選擇結盟。

  對於納德拉來說,與Meta隊形站位可以讓微軟在大模型的生態战爭中更加穩固。

  首先,微軟依然需要开源,开源在未來的大模型競爭中將持續扮演重要的角色。

  开源天然具有人才參與衆多、迭代速度快、垂類覆蓋效率更高的生態能力。雖然OpenAI拿下頭籌,但开源社區的進步速度依然很可觀。比如Llama只用了大半年的時間、使用參數70B,已經趕上了175B、耗時2年的GPT3。

  尤其是如果未來开源路线成爲了行業解決方案的主流,Llama與Azure深度結合,或許真的可以幫助微軟雲業務完成對AWS的彎道超車(2022年底Azure市佔率23%、AWS爲32%)。畢竟相比於Windows和Office,Azure才是微軟最賺錢、最有潛力的業務。

  其次,开源大模型的不斷發展,必然讓愿意砸錢做封閉系統的廠家也自然會越來越少。

  比如Bard在Llama2之後就受到了不小的壓力。除了許多好事者在晚上討論bard未來長期發展的壓力外,有媒體報道稱谷歌內部人士也曾撰文稱bard在對抗开源社區時優點喫力,後者進步神速且成本更少、場景更豐富。

  在大模型超級投入的產業結構沒有變化的情況下,封閉式大模型依然會有其存在的合理性,但可能將僅僅限於極少數領先者,而其中大概率會有OpenAI。

  如果OpenAI有護城河,那它的名字可能叫Llama2。

圖源:valasys

  當然,OpenAI其實也並不是微軟的“親兒子”。

  在100億美元投資後,微軟雖然擁有75%的分紅權,但實際上也只佔有OpenAI 49%的股權。換言之,微軟雖然手握大量的OpenAI資源,但並不完全擁有OpenAI絕對的控制權。

  但與llama合作像是一個標志,手握OpenAI的微軟其實正在成爲遊戲規則的制定者:

  它既有最具潛力的AI基礎設施Azure,也有最前沿的商業化變現接口Windows copilot。而當最核心的基礎設施和渠道能力在微軟手上時,OpenAI也只是微軟的“超級程序員”。

  當Meta等平台成熟後,微軟可以再引入更多的“程序員”,甚至开放更多的系統級場景給开源生態、從而讓Windows系統的生產力進一步提升。

  實際上,OpenAI原本就只是納德拉重注AI和語言大模型的一個選項。

  在ChatGPT之前,微軟甚至和英偉達合作开發過5300億參數的大語言模型威震天-圖靈Megatron-Turing,是當年最大的基於transformer的模型,參數比GPT3多了好幾倍,講究的是絕對的大力出奇跡。

  可最後威震天還是輸給了奧特曼,於是威震天才選擇了买下奧特曼。

  但微軟內部其實一直沒有放棄大模型的相關技術路线开發。

  例如6月時,微軟就發布了13億參數的“小型”大語言模型 phi-1。有OpenAI作爲核心資產,微軟不走“大力奇跡”模式,而是改用號稱“教科書等級”的高品質資料集訓練模型,讓實際效果勝於千億參數的 GPT 3.5。7月時,微軟還提出了新的大模型架構RetNet,稱其可以在更大數據維度基礎上,比transformer更優。

圖源:arxiv.org

  大模型的战事還遠沒到中場,威震天與奧特曼們的遊戲或許才剛剛开始。

現在送您60元福利紅包,直接提現不套路~~~快來參與活動吧! 海量資訊、精准解讀,盡在新浪財經APP

責任編輯:張靖笛



標題:微軟不想被OpenAI架空

地址:https://www.utechfun.com/post/244803.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡