在不爲人可知的特殊渠道裏,英偉達芯片生意一度風生水起。在這一波囤積的算力釋放之後,倒爺們會逐漸沉寂,最終大多數都會消失
文 | 顧翎宇
編輯 | 謝麗容
3月30日,美國升級對華芯片出口禁令,表示將對中國出口的AI半導體產品採取“逐案審查”政策規則,全面限制英偉達、AMD以及更多更先進AI芯片和半導體設備向中國銷售。
這一舉動實質影響有限——在2022年和2023年,美國已經兩度收緊對華AI芯片出口。產業界普遍對出口的口子被重新擴大不抱幻想。從2022年下半年开始,中國公司就开始瘋狂搶購英偉達等AI芯片,一張GPU售價一度飆漲至接近40萬元。
一個被普遍接受的觀點是,在國產芯片能夠逐漸替換英偉達之前,仍舊有至少三五年的過渡期。擁有足夠多的英偉達芯片,目前暫時是大多數中國公司參與新一輪AI競爭的生命线。
這也催生了一個特殊職業:倒賣英偉達芯片。傳聞裏,這生意一本萬利,倒爺們神通廣大,賺得盆滿鉢滿。果真如此嗎?
我們試圖講述一位掮客在此間經歷的瘋狂、欲望和欺騙。人類歷史上下一場科技革命最重要的燃料,世界上最稀缺的算力資源,如何在無數隱蔽的小黑屋和推銷電話裏,被決定了流向——這正是阿誠的故事的特別之處。
“5個億”
阿誠號稱自己搞成了5個億的生意。
他曾是一個普通的英語老師。2023年9月,阿誠入職深圳一家賣英偉達芯片的分銷公司。做的第一件事,是給自己整了一套全新的名片。即使那時他身上已經裝了六七種不同身份的名片,隨時可以對不同的人展开不同的說辭,但沒有哪個身份比這張名片上的頭銜更讓他覺得有面子了——新紀元科技有限公司中國區銷售總負責人。
只要他不說,沒有外人會猜到,包括總負責人在內這公司只有兩個銷售——阿誠是其中一個,再加上老板、財務、售後,他們就开始搞事了。
在絕對的產品力面前,任何銷售技巧都是多余的。在一個500人的芯片大群裏,我只加了誠哥一個人,因爲他的群暱稱太有誘惑力了:誠哥H800。
H800,英偉達特供中國的一款數據中心GPU,也是2023年大模型算力競賽裏中國公司能合法买到的最先進的GPU。當下,英偉達就是訓練大模型所需算力的最優解。全世界都在搶購。有人說,大模型的風吹了一年多,只有兩撥人賺到了錢:一撥人賣AI課、一撥人炒英偉達芯片。
2023年10月,美國宣布擴大對華芯片管制,H800等四款產品也被要求禁運。當天,英偉達特供中國的A800和H800芯片停止接單。接下來,價格是按小時漲的,短短一周內,單張H800卡的報價幾乎從20萬元人民幣翻了一番。一台H800服務器在10月初的服務器售價爲220萬元,到了10月底已經飆漲到300萬元。
半年後,在深圳南山附近的一家咖啡店裏,誠哥問我,“你猜我們五個人,一個月賣了多少錢?”
“5——個——億哦。”許是很滿意我已經驚訝到接不上話,他主動吐露了答案。我看着這個西裝下穿着運動鞋、風塵僕僕的80後男人,他看起來真誠、老實,微微含着肚腩,給人一種靦腆的感覺,只有瞳孔因爲興奮而明顯放大——我突然相信了,他剛才告訴我他老板說他炒芯片時的狀態——“阿誠啊,你一炒芯片就眼睛發光,肯定是要發大財哇。”
H100,財富密碼
發財,首先要有機會。兩年前,對阿誠來說,機會還顯得那么有距離。
那時他在英語教培機構工作,別說大財了,想在深圳买房要攢錢到下輩子。他不甘心。2021年7月。雙減政策一出,阿誠是機構裏第一個跑路的人。
一個沒了工作的35歲男人,在不少地方要被歸類爲中年loser(失敗者)。但是深圳有自己獨特的造富生態,單車變摩托的故事俯拾皆是。在阿誠看來,早年賣山寨機,“互聯網+”興起時玩地推,等到比特幣行情起來了再用顯卡挖礦,發幣割韭菜的,很可能就是同一撥人。
風口在變,身份都是自己給的。
當時,這個風口是“炒芯片”。既然是炒,就說明有套利的空間。疫情後缺芯危機愈演愈烈,珠三角活躍着上萬個芯片黃牛,一些公司一個月就可以招聘100個芯片銷售。阿誠折騰起了芯片。在外人看來。從英語老師轉行賣芯片實在是匪夷所思,但是在誠哥的口中,這個難度並不存在,“公司招人時,對我發了個面試邀請,我就過來了”。
不需要專業知識嗎?我很懷疑。
“其實……”他頓了一下說,“很多時候都是現學的。”
他認爲,高槓杆的事情才有得賺。倒賣信息差就是槓杆最高的賺錢方式。越是風口上的行業,信息差越高,槓杆越高。如果在風口上,個人能力的參差似乎並不重要。
問題是,一窮二白的人如何跟上風口?
誠哥其實也不知道,他能做的,就是跑動得勤快一些。短短一年不到,他加了幾百個行業群,跑了幾百場會,換了幾百張名片,他的身上有一種深圳式的搞錢執着。即使千裏迢迢跑到外地去參會他也很少覺得辛苦。
他深信一點:只要圈子對了,賺錢就像呼吸一樣簡單。
珠三角成爲中國電子信息產業集聚地已經快40年,近些年一個越來越明顯的變化是,國際局勢任何風吹草動,都可能改變這裏一群人的生計。
2022年底,大模型开始席卷科技圈。誠哥發現,有一個詞高頻地出現在圈子中。這些人無論原來是在挖礦、玩NFT、搞元宇宙,現在,他們有了一個新的財富密碼:H100。
H100,英偉達這一輪市場行情的起點。如果說英偉達當下是訓練大模型所需算力的最優解,H100就是最優解中的明珠。
大模型的競爭會被稱爲算力軍備競賽,是因爲大模型本質上還是一種大力出奇跡的暴力美學,換句話說,想要獲得更強大的模型效果,就得靠堆卡,堆更多、更強大的卡。
供需極度失衡。行業媒體GPU Utils曾經做過一個測算,H100一年的出貨量大約也只有55萬張。但是,僅美國大型科技公司和少數幾家明星初創公司,對H100的需求量一年內就達到了43萬張。對META之類的巨頭公司來說,囤上10萬張H100在商業競爭中才有先機。而對初創企業來說,沒有1萬張H100,連坐上牌桌的資格都沒有。
中國也差不多的情況,但中國公司的需求被美國政府的出口限制強行摁住。2022年10月,美國對華啓動芯片管制。幾乎是在H100和比其性能稍弱的A100被禁運的同一時間,OpenAI發布了chatGPT,從那時起,有多少張英偉達卡,成了中國科技公司AI實力的一把標尺。幾乎所有選擇宣布加碼大模型的互聯網大廠,在財報會上一定會被問的一個問題是,公司儲備了多少英偉達卡?
第一撥行動者出現了。在2022年夏天之前,原價18萬多元人民幣的H100在中國需求量並不驚人,性價比低點的A100甚至有些滯銷。然而,芯片禁令後市場上不多的存貨就像被蝗蟲過境,一掃而空。
四個月後,中國的大模型業進入了“百模大战”時間,英偉達面向中國客戶推出H800,這個版本被俗稱爲H100的“閹割版”,英偉達在這個版本裏去掉了受美國政府那一輪禁令管制的參數。加上此前已經推出的A100低配版A800,英偉達的中國客戶還算有卡可用。搶卡的競爭又來到了一個新賽點。
至少有五類角色在瘋狂搶購:電信運營商、服務器大廠、互聯網和AI公司,以及業務和算力無關但是現金流充沛的大企業。
英偉達芯片在中國市場有四種渠道流通。其中兩種可以訂購中國特供版的官方渠道:一條通過英偉達自己的經銷商體系,一條通過英偉達認證過的服務器大廠經銷商體系,這兩條渠道上擠滿了排隊下單的大廠,交付的時間則取決於英偉達,最快也要到2023年底。爲了插隊,大廠高管們八仙過海式的拉關系,甚至不乏上市公司老板直接飛去美國見英偉達CEO(首席執行官)黃仁勳。
另外兩種渠道則通過黃牛,這個渠道多少有點暗箱操作:一類有海外背景,可以有特殊的海外渠道讓H100/A100流入內地;另一類則是體量更小的散戶,他們的貨源來自內地,“至於具體是哪裏,那就要看各自的本事了”。
“一卡難求”的情況甚至還推高了國產芯片的市場空間。誠哥一开始沒有渠道,賣不了英偉達芯片。他花了四個多月,幫一家號稱“中國英偉達”的國產AI芯片公司成交了一筆200多萬元的合同。
可是,他卻沒能拿到一分傭金。
誠哥認爲,之所以說好的傭金也不給他,是因爲這公司自己處境艱難。他的依據很簡單,市場上愿意买英偉達之外芯片的廠商寥寥,“客戶买英偉達的卡是拼手速,秒慢沒;买這公司的卡要磨磨蹭蹭,討價還價”。即便賣出去了,客戶的目的只是爲了符合國產芯片需佔一定比例的採購要求,买了卡也通常是堆在庫房。
此時,對在2023年向英偉達下訂單的大多數中國公司來說,H800遙遙無期,A800是唯一到貨的產品。這一產品剛推出時售價爲7.4萬元,到了6月底,黃牛开出的高配版的售價逼近10萬元,而到了7月下旬,價格已超過12萬元。無論是出於擡高價格還是恐慌心理,市場在瘋傳,美國將要再次收緊芯片管制。
入局者也越來越多了。如果說一年前的夏天,大量囤英偉達卡的公司必定業務和其有相關,現在也可能是一個賣味精的公司或者是一家女裝公司。囤卡的散戶也從過去長期依賴英偉達顯卡挖礦的大佬,變成了現在可能是任何一個毫無背景的人。
比如一個曾經的英語老師。
誠哥就是那個時候入局的——新紀元這家公司當時成立才一個月,但有“渠道”。
“先籤了再說”
從外表上看,新紀元實在是不夠新。在大廠林立的深圳南山,這裏着實太簡陋了:兩間屋子,五把椅子,還有一些電腦和手機,就是全部家當。
誠哥一進去就發現了這是個草台班子。雖然他之前只短暫賣過四個月國產AI芯片,但他已經是公司裏經驗最豐富的人。老板是個快60歲的老江湖,年紀不小,看起來卻很有一股瘋勁。他對阿誠直言不諱,招他來,是因爲他有些經驗但是又不多,“太會的人拿捏不住”。
被寄予厚望的誠哥獲得了使用單獨辦公室的權利。不是因爲他資深,而是他不喜歡和同事們在一起打電話。
這種古老的營銷手段,在這個新圈子裏卻有用。誠哥和同事們獲客的方式就是先在網上找到哪裏出現了招投標的消息,再找到消息中參與公司的聯系方式,直接打過去。
誠哥有一個觀察,人們對陌生電話常充滿警惕,但是對推銷英偉達的陌生電話格外寬容。在聽完他說“你好,我是賣英偉達卡的”之後,幾乎所有人都會愿意聊下去。無論對方是一家上市公司AI業務總監,或是某個大型實驗室採購負責人,通常對話不需要進行十句,雙方加上微信,誠哥便會把報價和合同推過去。
在一個絕對的賣方市場裏,有了貨源就意味着有了權力。在中國,英偉達的兩種官方渠道一類是原廠—總代理—經銷商—市場;另一類是原廠—服務器大廠—經銷商—市場。
看起來,每種渠道只有四類角色,是一個組織嚴密的金字塔狀;但事實是由於市場過熱,這兩個結構已經被衝擊成網格式的蜂巢狀了——換句話說,每一類角色的背後,都可能分化出無數二道販子,交易也不再是逐級流通。
誠哥的公司就是這樣遊離在第二種邊緣。“我們老板和服務器大廠那邊有些關系,能搞到卡。但我們沒有大廠正規經銷商的資質,充其量只能說是遊擊隊。”不過,即使是遊擊隊在當時也擁有了不一般的地位。誠哥說,他見客戶從來都是“讓客戶過來”,和客戶喫飯時“他們對能搞到貨的人佩服得五體投地”。
如今,阿誠回想起來那段日子,能想到的形容詞只有一個,“瘋狂,太瘋狂了”。10月17日,美國擴大對華芯片管制範圍,英偉達在中國市場流通的所有AI芯片均被列入其中。
這份管制原定有30天公示期。這段時間也因此被行業人士視爲“最後30天窗口期”。理論上說,最後30天,英偉達等企業會把所有先進AI芯片產能、庫存都優先供給中國市場。這會是中國企業搶購英偉達芯片最後的“操作窗口”。
此時,H800單卡市場價已經飆升至21萬元一張左右。很快,新紀元公司就成交了一筆4億元的合同。還沒有來得及慶祝,就又籤下了一個1億多元的單。
我在禁令出台當天和他通了一個電話,那時他剛剛接完一個十幾億元的訂單垂詢,聲音嘶啞,但是是破音的那種興奮。接下來,他的電話就再也沒有打通過——他太忙了。過去對他發消息從來不回的大廠高管,爲了买卡一天發十幾條消息。一家公司問他們能搞到多少張,“280萬元以下的H800服務器有多少台我們都收”。誠哥在那幾天幾乎瘋狂,不需要喫飯,也不會疲勞,只要在呼吸,就可以賣卡。他根本沒有考慮過有沒有貨源能交付。
“先籤了再說。”
他閉上眼睛,想睡一會,腦海裏又響起來狂躁的詢問聲,“有卡嗎!有卡嗎!有卡嗎!买卡嗎!买卡嗎!买卡嗎!”
人類歷史上下一場科技革命最重要的燃料,世界上最稀缺的算力資源,就這樣在這些隱蔽的小黑屋和電話裏,被決定了流向。
數字遊戲
僅僅是在一周之後,阿誠就开始懷疑,這一切不過是在玩數字遊戲。
10月25日,美國宣布禁令立刻生效,30天窗口期以一種戲劇性的方式被掐斷。不久之後,和上次在英語培訓機構一樣,他先跑路了。
原因很簡單。那些天價訂單生意,隨着交付日期的臨近,他太擔心老板要卷款跑路了。這擔心始終存在於公司所有人的心裏。空手套白狼的例子太多了——假設A公司什么也沒有,也可以和B先談妥一筆供應合同,A再去找C拿貨,C的貨可能也是從D或者E處加價买來,中間A發現F的开價比B要高,於是此前的一切白紙黑字都可以作廢。
有多少合同能夠落地?就像那筆4億元的訂單,貨物從籤單到完成交付中間隔了12周的時間,市場價漲了100多萬元,而毀約只需要成單價1%的罰金,他很懷疑,老板不會選擇交付。
那么那批貨到哪裏去了呢?
誠哥也不知道。他告訴我,自始至終,他沒有見到那批貨,就像他也沒有見到那筆錢一樣。
更重要的是,誠哥突然發現,90%的倒爺賺不到大錢,這讓我意外。他給我算了一筆账,假設一台H100八卡服務器出廠價250萬元,終端市場價280萬元,中間看起來有30萬元的差價,但是很可能倒了十次不止,一家只能賺3萬元。這些利潤大部分被掌握貨源的老板吞掉,他作爲打工人,抽成是利潤的3%。
因此,這生意只有掌握貨源的人才能賺到錢。他有一個切身感受,這兩年來各家瘋搶GPU的力度遠遠超過了真實需求,更類似於市場對美國隨時有可能加碼的芯片制裁的本能反應——只要科技競爭的陰影存在,高端AI芯片必然是期貨。不少公司是在以此爲投資。甚至可以說,找散戶下單的公司,將來相當一部分還會選擇再把芯片賣出去。
歸根結底,二道販子這么多,是因爲貨源太稀缺了。“無論芯片通過什么方式進入國內,就像水流一樣,封鎖當然不可能完全封鎖,但已經足夠鎖住大部分的水流了。”阿誠說。
事實是,所有的瘋狂都是徒勞。在2023年10月17日芯片禁令之後,合法渠道到貨的H800寥寥無幾。
在2023年10月芯片禁令之後,合法渠道到貨的H800寥寥無幾
財報顯示,2023年第三財季,英偉達中國大陸收入高達40.3億美元,環比大漲47%。出口管制規則出台後,2023年第四財季英偉達中國大陸收入僅爲19.5億美元,環比大降52%。當季,中國大陸僅佔英偉達總營收的8.8%,是歷史最低點。
英偉達和AI相關的數據中心業務在中國大陸的收入佔比過去長期達到20%-25%。但自2023年10月起,該收入顯著減少。英偉達高層表示,2023年第四財季,中國大陸在數據中心收入中的比例已降至個位數,預計下個財季也將保持這一水平。
對大多數渴望暴富的人們來說,那些像做夢一樣的日子,最後真的落了一場空。
拋物线後半段
不過,英偉達的行情仍在持續。
2024年,英偉達將會推出H200等四款革命性AI計算產品。同時,根據瑞銀近期的研究,其交付時間在縮短,已經從2023年末的8個至11個月縮短了一半時間。一些機構預測稱,英偉達在今年將銷售大約150萬到200萬個AI GPU,數量是2023年3倍。
2024年3月18日,美國聖何塞,英偉達CEO黃仁勳。在英偉達年度技術峰會GTC 2024大會上發表主題演講 圖/IC看起來,這些與中國無關了。但是,這裏有一個連鎖反應在後,英偉達在全球範圍內供應能力的增長將會給中國企業帶來更大的競爭壓力。隨着全球AI應用水平因GPU供應的大量增加而快速提升,中國必須尋找替代方案來應對。
目前,通過官方渠道購买H/A800和H/A100已經不可能。黃牛之間流通的芯片價格略有回落,但依舊令人咋舌。離开新紀元以後,阿誠自己开了一家公司,剛剛給客戶報了價,一台搭載八個H800的AI服務器價格還是約300萬元。好在一些此前被囤積的芯片正在被釋放,市場上現貨充足,一般兩周以內就能交付。
因爲生意不穩定,他還同時在另一家英偉達代理商那裏上着班。即使AI芯片受限,他還是堅定看好英偉達包括遊戲顯卡和自動駕駛在內其他業務在中國的前景。
這塊市場英偉達無法放棄。在芯片禁令不久之後,英偉達再次針對中國市場推出了三款在數據傳輸速度等關鍵性能上進一步降低的芯片:H20、L20和L2。市場上傳言,這些芯片性價比太低,並不受中國公司青睞。中國公司更愿意採購國產新品。
阿誠對這種傳聞嗤之以鼻。“那些只是外界的一廂情愿”。具備推理能力的L20最先面世,但是迅速被幾家互聯網大廠搶購一空,沒有多少能流入到市場上。而適用於大模型訓練的H20也不是中國公司不想买,而是买不到。H20在今年1月开始接受預訂,但僅限大客戶。
中國公司想要通過正規渠道獲得英偉達芯片,可能性越來越小了。
這反而激發了部分公司對特殊途徑的需求。無論是將芯片通過非禁運國家以轉運的方式進入中國市場,還是考慮把數據中心業務建在海外,在業內人看來,即使審查的手段越來越嚴。愿意冒險的公司數量仍在明顯變多。
3月30日凌晨,美國商務部宣布了一項新的出口管制規定,對涉及美國和中國澳門等地區的對華半導體產品銷售限制進行了調整,同時,美國對華出口的AI半導體產品將實施“逐案審查”政策,對技術等級、客戶身份、合規計劃等進行全面審查。也就是說,新規進一步限制英偉達、AMD以及其他先進AI芯片和半導體設備對中國的銷售。
想要通過特殊渠道讓芯片流入中國,也越來越難了。
這在意料之中。阿誠告訴我,這些變化在短期內影響不大。新規主要限制AI芯片未來流入中國的可能,但是中國市場在此前囤積的芯片已經足夠很長一段時間供需。他注意到,交付周期在明顯縮短。之前一些在瘋狂搶卡的公司,現在已經开始賣卡和做算力租賃了。過去倒爺們只需要強調“有卡,速來”,現在還要強調“量大,可持續供應”。
不過,可以預見,在這一波囤積的算力釋放之後,倒爺們會逐漸沉寂,也許最終大多數都會消失。“中國區需求量的高峰期是在去年三季度。炒貨的高峰期是在去年四季度,但是需求量已經在減少了。”他認爲,中國公司對英偉達的需求已經過了拋物线的高點。接下來,英偉達在中國的發展重點不是是否衰退,而是衰退的曲线如何變化。
技術的領先是有時間期限的。對中國公司來說,如果無法購买更先進的英偉達產品,現有存貨的優勢終將隨着時間變化而減少。他聽說了一些關於國產AI芯片如今供不應求的故事——情況和去年這時已經大不同了。他對華爲芯片很感興趣,有機會的話也想賣。
不過眼下,阿誠還得先做好英偉達,年前他剛剛成交一單700萬元的生意。“一切都會越來越好的。”他充滿信心,因爲現在的圈子多得是企業中高層和行業大人物。
他向我談起一個關系密切的中間人,告訴我對方“是某某亞太AI協會的領導,協會裏有100多位院士”。他說,之前對方幫他介紹過1筆500台以上的大訂單,如果成了,他要付給對方一台3萬元的中介費,也就是對方至少可以賺1500萬元。
“可惜沒有成。”我看着他一臉真誠的遺憾,有些常識不確定他知不知道,中國大陸並不允許公司注冊名以亞太开頭——所以我一看到以亞太爲名的機構,很難不聯想到注冊在中國香港的皮包公司。
(文中新紀元和阿誠均爲化名)
標題:英偉達芯片倒爺,快玩不動了
地址:https://www.utechfun.com/post/358586.html