聚焦AI Infra賽道,硅基流動AI應用的“賣鏟人”

2024-07-22 18:42:16    編輯: robot
導讀 前言: 在當前的年度背景下,特別是針對國內市場,大模型的落地實施將主要聚焦於to B服務領域。 隨着大模型推理部署的成本持續下降,to C的應用探索也將逐漸增多,這有望爲市場帶來更多創新型的超級應用...

前言:

在當前的年度背景下,特別是針對國內市場,大模型的落地實施將主要聚焦於to B服務領域。

隨着大模型推理部署的成本持續下降,to C的應用探索也將逐漸增多,這有望爲市場帶來更多創新型的超級應用,從而推動整個行業的進一步發展。

作者 | 方文三

圖片來源 |  網 絡 

硅基流動成AI應用[賣鏟人]

近日,硅基流動(SiliconFlow)成功完成了總金額接近億元人民幣的天使+輪融資。

此次融資由某知名產業方擔任領投角色,跟投方涵蓋了智譜AI、360以及水木清華校友基金等業內知名企業及機構,同時,老股東耀途資本亦繼續以超額額度參與本輪融資。

針對公司未來的發展規劃,硅基流動將重點聚焦於技術產品創新以及全球商業化的推進。

公司將持續優化自主研發的SiliconLLM和OneDiff推理引擎,致力於提升模型的推理效率和用戶體驗。

此外,硅基流動還將對SiliconCloud平台進行進一步升級,持續推出高效能、低成本的AI模型雲服務。

硅基流動的創始人袁進輝,曾任OneFlow和微軟亞洲研究院的主管研究員,其研發的LightLDA系統曾榮獲微軟亞洲研究院院長的特別嘉獎。

硅基流動成立於2023年8月,旨在構建規模化、標准化、高效能的生成式AI計算基礎設施平台。

公司提供包括模型雲服務平台SiliconCloud、大語言模型推理引擎SiliconLLM、高性能文生圖/視頻加速庫OneDif等在內的多款產品,助力企業和個人用戶高效部署AI模型。

自2016年起,袁進輝所帶領的OneFlow團隊作爲世界範圍內唯一專注於研發工業級通用深度學習框架的創業團隊,成功推出了高性能分布式深度學習框架。

隨着以大模型GPT爲代表的技術熱潮興起,OneFlow團隊所積累的大模型訓練技術和認知得到了充分驗證。

2023年,OneFlow團隊在處於大模型風口之際,被原美團聯合創始人王慧文所創立的大模型公司[光年之外]並購。

隨後,[光年之外]因故被美團並購,袁進輝帶領團隊創立了新公司[硅基流動]。

與大廠相比,硅基流動的核心優勢體現在兩方面。

①公司具備深厚的大模型技術積累與創新,擁有頂尖的AI Infra技術能力團隊和作品,原班技術團隊在業界已打造出开源訓練框架OneFlow。

②其次,作爲創業團隊,硅基流動能夠快速捕捉到行業需求的變化,並靈活作出相應的適配。

截至目前,硅基流動已經歷了兩輪融資。今年1月,公司完成了上一輪5000萬元的天使輪融資,由創新工場領投,耀途資本、奇績創壇、美團聯合創始人王慧文等跟投,投後估值達數億元人民幣。

核心產品體系已初步成型

硅基流動自主研發的SiliconLLM大模型推理引擎,經過對內核、框架、機制及模型的深度優化,實現了業界頂尖的推理效率,其速度相較於同類开源產品,顯著提升超過十倍。

在應對MoE架構、超長上下文處理和超低延遲等復雜場景時,硅基流動的產品展現出業界領先的實力。

硅基流動近期推出了一站式雲服務平台SiliconCloud,該平台致力於提供高效能、低成本的多品類AI模型服務(MaaS)。

SiliconCloud不僅集成了全球最新、最頂尖的开源模型,還通過自研的推理引擎套件(SiliconLLM & OneDiff)顯著降低了大模型推理的成本,爲用戶提供了卓越的性能體驗。

這使得开發者能夠專注於產品創新,無需擔憂大規模推廣所帶來的高昂算力成本。

SiliconCloud匯聚了衆多主流大模型,包括阿裏旗下的通義大模型Qwen2、智譜旗下的GLM-4、幻方量化旗下的DeepSeek V2系列开源模型,以及文生圖模型SDXL、SDXL Lightning、PhotoMaker、InstantID等。

基於硅基流動在AI Infra領域的深厚積累,SiliconCloud平台上的大模型展現出更快的響應速度和更低的算力成本,極大提升了AI應用开發效率,並顯著降低了部署成本。

例如,使用SiliconCloud調用文生圖模型Stable Diffusion,可以實現1秒出圖的高效能;

而調用大模型DeepSeek V2時,其響應速度可達50 Tokens/s。

這得益於SiliconCloud集成的視頻生成推理引擎OneDiff,它使文生圖模型SDXL的性能加速最高可達3倍。

AI Infra的重要性逐步顯現讓賽道收益

AI Infra(人工智能基礎設施)指的是在大模型生態系統中,除了算力之外,爲支持大模型訓練和部署流程所構建的一系列底層軟件技術設施。

這些設施爲开發者提供了便捷高效的設計模型或使用模型的環境,無需過多關注底層算力資源的調配。

AI Infra層,作爲銜接AI應用層與算力芯片層的中間環節,其在當前大模型時代背景下扮演着類似[操作系統]的核心角色。

面對如何優化大模型訓練與推理的效率,充分發掘底層硬件的潛能,並降低生成式AI應用开發的門檻與成本等挑战,AI Infra層承擔着解決這些關鍵問題的重任。

隨着ChatGPT等技術的火熱,大模型及其相關應用持續湧現,作爲連接算力和應用的AI中間層基礎設施,AI Infra的技術和商業發展前景備受矚目。

當前,大模型的發展尚處於初期階段,快速構建和訓練調優模型成爲行業關注的焦點。

然而,隨着行業的逐漸成熟和應用層的蓬勃發展,基礎設施的支撐作用將日益凸顯。

AI Infra不僅爲應用开發者搭建了與硬件和模型之間的橋梁,提升了开發效率和創新能力,還能有效滿足市場對高性能、低成本AI解決方案的迫切需求。

在國內,AI Infra領域的創新企業包括無問芯穹、清程極智等,二者均背靠清華大學,得到了來自智譜AI等投資者的支持。

其中,無問芯穹由清華大學電子工程系主任汪玉發起,創始人夏立雪爲其學生;而清程極智的創始人則來自清華計算機系。

在國際上,英偉達、亞馬遜、Lepton AI、OctoAI等企業以及伯克利大學开發的vLLM等也在此領域展开競爭。

與文心一言、通義千問等應用層大模型產品相比,硅基流動所聚焦的AI Infra賽道更注重連接算力和應用的AI中間層基礎設施,涵蓋了數據准備、模型訓練、模型部署和應用整合等多個環節。

據中金數據預測,目前AI Infra產業正處於高速增長的發展初期,預計未來3—5年各細分賽道有望保持超過30%的高速增長。

結尾:

展望未來,隨着模型的不斷升級、架構的優化以及定制芯片等降本增效措施的深入推進,AI應用的盈利能力有望實現顯著提升,進而逐步凸顯AI應用層的價值。

在此過程中,與开發者緊密關聯的AI Infra生態位將展現出顯著的優勢。

同時,值得注意的是,未來AI模型的參數量將呈現持續增長的趨勢。

當模型規模擴大,現有的深度學習框架可能無法滿足开發者的實際需求,這就要求對底層的AI框架進行重構。

這不僅是技術進步的必然,也爲創業公司提供了新的發展機遇。

部分資料參考:創投日報:《智譜AI、360都投了這家AI應用[賣鏟人]》,智能湧現:《袁進輝新公司「硅基流動」獲近億元天使+輪融資》,每日經濟新聞:《硅基流動完成近億元天使+輪融資》,金角財經:《國產AI,逃過一劫》,IPO早知道:《硅基流動再獲近億元天使+輪融資》,晚點LatePost:《光年之外聯創再出發,與袁進輝聊 AI Infra到底做什么》,AI科技評論:《OneFlow 袁進輝再創業,成立新公司「硅基流動」》

       原文標題 : AI芯天下丨產業丨聚焦AI Infra賽道,硅基流動AI應用的“賣鏟人”



標題:聚焦AI Infra賽道,硅基流動AI應用的“賣鏟人”

地址:https://www.utechfun.com/post/400778.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡