英偉達10億美元投資初創公司!AI創業難度大但機會猶存?

2025-01-03 18:40:15    編輯: robot
導讀 DeepSeek珠玉在前。 一次AI革命,讓原本名聲不顯的OpenAI一躍成爲全球知名企業,估值超過1500億美元。但若討論哪家企業才是AI時代的最大受益者,NVIDIA絕對是唯一答案。 財報數據顯...

DeepSeek珠玉在前。

一次AI革命,讓原本名聲不顯的OpenAI一躍成爲全球知名企業,估值超過1500億美元。但若討論哪家企業才是AI時代的最大受益者,NVIDIA絕對是唯一答案。

財報數據顯示,2024年第三財季,NVIDIA營收高達350.82億美元,同比增長93.61%,歸母淨利潤193.09億美元,同比增長108.90%,其中數據中心業務營收爲308億美元,同比增長高達112%,公司市值更是超越微軟,位列全球第二。

AI企業與NVIDIA屬於互相成就,前者需要後者提供GPU或專業AI計算卡,用於大模型的訓練和推理,他們的需求助力NVIDIA營收、利潤屢創新高。正因如此,NVIDIA也清楚需要付出一定的成本扶持AI公司,培養客戶群體。

據英國《金融時報》報道,剛剛過去的2024年,NVIDIA累計參與了50多輪融資和多筆交易,向AI初創企業累計投資了約10億美元,相較2023年的8.72億美元增長了大約15%。按照這個趨勢,2025年NVIDIA大概率會投資更多AI初創公司。

除了NVIDIA,其他國內外互聯網公司也在不斷增加AI領域的投入,一邊打造自己的AI團隊,一邊投資其他AI公司。對於小型AI公司而言,有機會獲得大企業的投資無疑是好消息,基於這種情況,2024年無數企業瘋狂湧入AI行業。

天眼查數據顯示,2024年國內新增AI相關企業超過50萬家。可在AI技術日漸成熟的今天,進軍AI行業真的還有機會嗎?

“錢”字當頭,AI創業入局難

AI大模型的黑盒特質使其可解釋性和可調試性較弱,對於語義的理解能力、數學邏輯和推理能力,以及可能存在的AI“幻覺”,都是困擾开發者的技術難題。訓練一款成熟可用的大模型,需要招募大量技術人才,去解決各種難題。然而行業的競爭促使企業互相挖牆腳,吸納AI人才的成本不斷飆升。

例如前段時間小米CEO雷軍親自出手,將參與過DeepSeek-V2大模型开發工作的羅福莉挖到了小米。網上甚至有消息稱,小米公司向羅福莉开出了千萬年薪。傳言可能會有些誇張,但羅福莉的年薪恐怕至少是7位數。

人才之外,GPU算力也是壓在AI公司心頭的重擔。仍以小米爲例,日前界面新聞爆料稱,小米正在着手打造萬卡算力集群。百度集團執行副總裁、百度智能雲事業群總裁沈抖曾表示,一個1.6萬張GPU的集群,採購成本就高達數十億元,更不用說搭建、運營、維護成本。

顯卡與機房.png

(圖源:AI生成)

萬卡集群只是开始,若想打造出頂尖AI,還需要購买更多GPU或專業AI計算卡。民生證券計算機首席分析師呂偉表示,以ChatGPT的6億月活數據計算,訓練任務大約需要12萬張A100,推理任務所需約35萬張A100。

爲滿足未來AI大模型的訓練和推理需求,OpenAI CEO山姆·奧特曼甚至提出了7萬億美元重塑全球半導體行業的計劃。算力集群的投入堪稱無底洞,最終需要多少才夠,現在任何AI公司都說不出確切數字。要知道,1984年上映的《終結者》電影中,覺醒了自我意識的天網系統,算力規模也僅爲每秒60萬億次浮點運算,不如一張RTX 4090。

招募人才和組建算力集群的成本或許很高,但總歸可以承受,更嚴重的問題在於,用於訓練大模型的數據不夠了。原定2024年中後期面世的GPT-5,至今未能完成訓練,主要原因之一就是數據不夠用。爲解決數據不足的難題,OpenAI被迫招聘工程師、數學家、物理學家編寫數據,用於訓練大模型。

顯卡與機房 (1).png

(圖源:AI生成)

AI大模型的參數量越多,性能上限就越高,但參數量需要大量數據訓練。爲訓練GPT-4和GPT-5,OpenAI幾乎耗盡了網上公开的論文、新聞資訊,以及社交平台上的帖子,甚至因此惹上了官司,被加拿大新聞社、加拿大廣播公司、Torstar、環球郵報等媒體起訴。

倒不是說數據完全被耗盡,只是剩下的數據未經公开,基本在各大公司內部,AI公司難以獲取到。山姆·奧特曼直言,未來訓練一個大模型的成本可能會超過10億美元。

人才、算力、數據三大成本在前,哪怕是互聯網巨頭也倍感壓力,更不用說湧入AI行業的初創公司了。

不過並非沒有低成本訓練大模型的方法,小米开出天價年薪招募羅福莉,目的很可能在於羅福莉的身份——DeepSeek-V2开發工作的參與者。

DeepSeek大獲成功,降本增效不是不行

最近一段時間,AI行業最火的新聞無疑是DeepSeek-V3模型的到來,其低至557.6萬美元的訓練成本,大約只是GPT-4的二十分之一,預計不到GPT-5的二百分之一。經過小雷實測,DeepSeek-V3在文字生成、數學推理等領域的體驗不輸豆包、文心一言、Kimi等國內極負盛名的AI應用。

DeepSeek全新大模型的成功,向其他AI公司傳達了一個信息——訓練大模型的成本可以不用很高。然而有舍必有得,低成本訓練出的大模型,存在一些難以解決的問題。

能夠以極低成本訓練出部分場景體驗媲美豆包、Kimi的大模型,DeepSeek的訣竅在於有三,第一來自MLA架構和MoE架構,前者利用多頭潛在注意力機制,可提取相鄰層的特徵並進行壓縮,從而減少計算量,降低大模型訓練所需成本;後者屬於專家混合架構,具備6710億參數,但每次僅激活370億參數,降低了對計算資源的需求。

顯卡與機房 (2).png

(圖源:AI生成)

第二是FP8混合精度訓練框架,以降低精度、壓縮鍵值爲代價,在盡量不影響模型性能的前提下,大幅節省了顯存和計算資源,可提升訓練速度,降低訓練成本。

第三爲模型蒸餾,普通大模型要利用大量數據進行訓練,蒸餾技術以被訓練好的模型爲“教師”,篩選出有效數據,去訓練一個“學生”模型,從而降低成本。DeepSeek之所以在开源模型領域享有如此之高的聲譽,並將DeepSeek-V3打造成當前最強开源大模型,蒸餾技術無疑是關鍵因素。

這些技術雖降低了成本,卻以犧牲精度爲代價,尤其是蒸餾技術,存在一個極爲嚴重的缺陷,即“學生模型”的能力無法超過“教師”模型。追求極致的AI企業不會過度採用蒸餾技術訓練AI,南洋理工大學計算機研究人員王漢卿表示,他認識的一线研究人員,基本沒人在搞模型蒸餾了。

事實上,利用其他AI產出的數據訓練大模型,幾乎所有AI企業都在做,但若過度依賴數據蒸餾,會出現生成數據偏差、喪失多樣性等問題,甚至可能生成無意義的回答。DeepSeek-V3上线後,便出現了回答用戶問題時自稱是ChatGPT的情況。

對此山姆·奧特曼親自回應稱,復制先行者的東西是相對容易的,去做新的、有風險的、有難度的事情是困難的,敢於挑战困難的研究人員,理所應當獲得更多榮譽,這是世界上最酷的事。盡管沒有明說,但山姆·奧特曼已是在嘲諷DeepSeek-V3抄襲,未來蒸餾技術也可能面臨侵權問題。

無論如何,DeepSeek-V3的成功,都爲其他AI公司和考慮入場的企業指出了一條新的道路,通過降低精度、壓縮內容、蒸餾模型,無需數億美元的高昂成本,也能訓練出表現出色的AI大模型。

AI行業,依然是“野心家”的樂園

近十年間,全球最成功的兩大新興企業該是新能源汽車和AI大模型,未來人形機器人有機會進入此隊列。新能源汽車行業的發展歷程,將在AI行業復現,初期參與的企業極多,但經過大浪淘沙,技術實力、管理能力不行的企業會逐漸被淘汰。

AI行業正處於從快速發展期向成熟期過渡的中級發展階段,任何企業都仍具有成長爲巨頭的機會。只是能否利用好這些機會,則要看AI公司的技術實力、管理能力、战略眼光。

顯卡與機房 (3).png

(圖源:AI生成)

當前AI行業依然可以入場,但只適合兩類企業,一類是財力雄厚,向行業頂峰進發的企業。此類企業將承擔起引領行業進步的責任,不斷开拓進取,將AI的能力推向高峰。

投入大約100億美元卻沒能生產出新能源汽車的蘋果公司和血虧1100億元的恆馳汽車說明,任何新興行業都存在大量風險,不是錢多就一定能成事。AI行業同樣如此,投入和產出未必成正比。不過風險與機遇總是並存的,做到極致的企業未來才能賺大錢。

另一類企業則是以“夠用就行”爲目的,不追求功能特性達到極致的公司,可通過降低精度和蒸餾技術,以較低成本打造體驗不錯的大模型。DeepSeek-V3訓練成本僅557.6萬美元,能夠負擔得起的初創公司不在少數。

至於空有野心卻實力不足的企業或創業者,已不適合現在的AI行業。盡管有NVIDIA、微軟等巨頭向初創企業投資,但那點錢相對於頂級AI大模型的开發工作無異於杯水車薪。AI行業依然是野心家的樂園,只是門檻比過去高了一些,入場需要更加謹慎。

來源:雷科技

       原文標題 : 英偉達10億美元投資初創公司!AI創業難度大但機會猶存?



標題:英偉達10億美元投資初創公司!AI創業難度大但機會猶存?

地址:https://www.utechfun.com/post/462995.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡