前言:目前,兩條路徑正在同步推進。一些人形機器人公司專注於構建硬件,並側重於訓練機器人全身運動的控制能力,而另一些廠商則採取垂直一體化的策略。
同時,還有其他公司致力於構建世界模型或通用模型。Physical Intelligence代表了第三種路徑。
作者 | 方文三圖片來源 | 網 絡
PI成立8個月估值24億美元
據《紐約時報》報道,美國機器人初創企業Physical Intelligence近日成功完成了四億美元的融資。
此次融資的主要投資者包括亞馬遜創始人傑夫·貝佐斯、風險投資公司Thrive Capital以及Lux Capital,而OpenAI、Redpoint Ventures和Bond亦參與了投資,使得公司在投資前的估值達到了二十億美元。
Physical Intelligence是一家致力於將通用人工智能技術應用於物理世界的新興企業,目前正致力於开發能夠驅動當前機器人技術及未來物理設備的基礎模型和學習算法。
該公司於今年三月在美國特拉華州正式注冊成立,總部設在舊金山。
成立僅一個月後,Physical Intelligence便從Khosla Ventures、Lux Capital、紅杉資本、Thrive Capital和OpenAI等知名投資機構成功籌集了七千萬美元的資金,當時公司的估值約爲四億美元。
Physical Intelligence官網介紹稱,該公司致力於將通用人工智能技術引入現實世界。
π0模型的訓練過程分爲兩個階段:預訓練和微調。
在預訓練階段,模型通過學習大量數據來掌握廣泛的知識和技能,以便適應各種不同的應用場景。
隨後,在微調階段,模型針對特定任務進行優化,以提升在這些任務上的性能表現。
此外,π0模型採用了流匹配技術,使其能夠處理連續的動作序列,而不僅僅是單一的、離散的步驟。
結合其混合專家架構,這一技術的應用顯著提高了模型在預測動作時的准確性。
谷歌斯坦福伯克利大佬領銜的團隊
公司的聯合創始人兼首席執行官Karol Hausman,曾擔任Google DeepMind的資深研究科學家,並兼任斯坦福大學的兼職教授。
Chelsea Finn,斯坦福大學計算機科學與電氣工程系的教授,同時也是Google Brain團隊的前成員,其研究興趣集中在如何通過學習使機器人和其他智能體變得更加智能。
Sergey Levine,加州大學伯克利分校電氣工程與計算機科學系的助理教授,專注於研究自主智能體通過學習獲得復雜行爲的通用算法,尤其在機器學習決策和控制領域有所建樹。
Brian Ichter,曾是Google Brain的研究科學家,並在斯坦福大學獲得博士學位,其研究方向是通過學習提升移動機器人在現實環境中執行任務的能力。
π0模型具有以下三大優勢
①π0模型展現了優秀的跨平台及跨任務遷移學習能力。
該模型通過融合視覺、語言和動作數據,實現了從物體分類到動態操控的多樣化技能。
其訓練數據集涵蓋了來自八種不同機器人的交互數據,以及开放的圖像和文本數據集,這使得π0能夠在不同的機器人和任務平台上進行遷移和適應。
這種跨平台的兼容性賦予了π0處理多種不同機器人配置的能力,包括單臂機器人、雙臂機器人和移動機械臂,從而顯著提升了模型的通用性和適應性。
②π0模型在任務處理和指令執行方面表現出色。它能夠通過[零樣本]方式執行任務,即在沒有特定任務樣本數據的情況下完成指令,這在動態環境中尤爲適用。
同時,π0還支持[微調]功能,可根據具體應用場景進行數據增強訓練,以提升復雜任務的執行效果。
這種靈活性和適應性使得π0能夠應對各種復雜任務,如疊衣服、收拾桌子、組裝盒子等,並在這些任務中表現出色。
③π0模型採用了獨特的技術架構和方法。它基於視覺-語言模型(VLM)構建,通過整合視覺、語言和動作數據,實現了復雜任務的操作。
在動作輸出模塊,π0運用了一種基於擴散模型變體的[流匹配]方法,該方法通過對連續運動指令的建模,實現了高頻動作控制。
這種高頻控制確保了機器人在動態任務中具備靈活的運動調整能力,從而提高了操作的流暢性和准確性。
與OpenAI志同道合使其獲得巨額融資
Physical Intelligence與OpenAI一樣,致力於從模型和數據層面打破傳統技術的局限。
①ChatGPT的精確語義理解能力是其核心優勢之一,對於π0模型而言,這種能力同樣至關重要。
π0模型必須具備理解物理世界交互指令和上下文的能力,這涵蓋了視覺、語言和觸覺等多種感官輸入。
②ChatGPT的優秀之處在於其能夠將宏觀問題拆解爲微觀問題,並巧妙地整合答案。
對於π0模型而言,這意味着它需要將復雜的物理任務拆解爲一系列可操作的步驟,並根據環境的實時反饋靈活調整其行動,以確保實現既定目標。
③ChatGPT的通用性體現在其能夠將人類知識遷移到語言交流中。
相比之下,Physical Intelligence的通用性則體現在其能夠將從互聯網規模數據中學習到的深層語義知識,成功應用於物理世界的實際操作中。
總體而言,ChatGPT之所以成爲一個重要裏程碑,是因爲其在理解及生成自然語言方面展現出優秀的能力;
而Physical Intelligence之所以吸引投資者的關注,關鍵在於其對物理世界的深刻理解和操控技巧。
結尾:
在現實世界中,讓人工智能執行諸如洗衣、疊衣、包裝等簡單任務,對於當前的人工智能技術而言,並非易事。
實際上,人工智能要真正理解物理世界的系統性工程,仍面臨諸多挑战。
然而,要實現所謂的AGI,人工智能必須走出黑盒,進入現實世界。
在這一過程中,機器人,尤其是人形機器人,被視爲人工智能在人類設計的社會環境中最佳的載體,這使得人工智能能夠具備通才通用性,從而使人形機器人能夠真正服務於人類。
部分資料參考:雷鋒網:《貝索斯領投、OpenAI連續跟投,這家機器人公司再融4億美金》,AIGC最前线:《Chelsea Finn帶隊的Physical Intelligence成果來了》,機器人前瞻:《28億!又一機器人公司完成巨額融資,OpenAI和貝佐斯都投了》,Robot獵場備忘錄:《估值約150億!具身大模型初創公司最新成果:機器人通用基礎模型[π0]》,人形機器人場景應用聯盟:《4億美元巨額融資!具身智能機器人創企估值飆升至170億》
原文標題 : AI芯天下丨分析丨成立8個月估值24億,這家機器人公司拿什么吸引了投資人?
標題:成立8個月估值24億,這家機器人公司拿什么吸引了投資人?
地址:https://www.utechfun.com/post/445928.html