GPT-4誕生1年,OpenAI把它放到了機器人上

2024-03-15 18:40:37    編輯: robot
導讀 作者:一號 編輯:美美 ChatGPT擁有了身體,機器人也有了靈魂。 從OpenAI在去年3月14日拿出GPT-4後,已經過了整整一年。顯然,在GPT-4誕生之後的這一年,一切都迭代得太快了,從GP...

作者:一號

編輯:美美

ChatGPT擁有了身體,機器人也有了靈魂。

從OpenAI在去年3月14日拿出GPT-4後,已經過了整整一年。顯然,在GPT-4誕生之後的這一年,一切都迭代得太快了,從GPT-4展現多模態能力,到千行百業都在談論AI,再到Sora引爆AI生成視頻的市場。

資深機器人專家Eric Jang在不久之前還預言,“ChatGPT曾在一夜之間出現。我認爲,有智慧的機器人技術也將如此。”

他或許沒錯,在一年後的今天,一家名爲Figure的公司在X上上傳了一段人形機器人的視頻。

在視頻中,Figure的人形機器人Figure 01,能夠完全與人類流暢對話,理解人類的想法,同時根據理解進行抓取和放置的操作,並解釋自己這么做的原因。而這只是OpenAI宣布和Figure共同合作推進人形機器人領域前沿的第十三天。

這段Demo迅速吸引了廣大網友的眼球,有人感嘆,AGI的曙光似乎就在眼前了。

沒弄虛未作假,這些都是機器人自學的

視頻發布之後,Figure AI的掌門人Brett Adock,在X上來了一番精彩解讀。

視頻中Figure展示了端到端神經網絡(end-to-end neural networks)框架下與人類對話的應用。在此過程中沒有任何遠程操作。並且機器人的速度也有了顯著的提升,开始接近人類的速度。

那具體是怎么做到的呢?

首先,Figure AI會將機器人攝像頭拍攝到的圖像和通過板載麥克風記錄到的語言轉錄成文本輸入到一個由OpenAI訓練的大模型中,這是一個能夠同時處理圖像和文本信息的模型。

然後,這個模型會處理整個對話的歷史記錄,包括以往的圖像,然後通過文本到語音的方式,生成語音進行響應,向人類回話。

這個模型還同時負責決定執行哪種已學習的閉環行爲來響應給定的命令,它將特定的神經網絡權重加載到GPU上,並執行相應的策略。

這樣做之後,Figure 01就有了很多有趣的新功能。例如描述它周圍的環境、在做決定的時候運用常識進行推理,並且會理解一些含糊的高級指令,例如當人類說“我餓了”的時候,它會將桌面上唯一的食物——蘋果,遞給人類,並用簡單的英語說明它爲什么這么做。

而關於Figure 01通過學習掌握的精細雙手操作技能,這些所有的行爲都是由神經網絡的視覺-運動轉換器策略驅動,能將像素直接映射到動作。這些網絡以每秒10幀的速率接收機載圖像,並以200hz的頻率生成24-DOF動作,包括手腕姿勢和手指關節角度。

簡單來說,預訓練模型會首先對圖像和文本進行常識推理,然後給出動作計劃;接着,機器人再基於已學習的視覺-動作執行策略,做出快速的反應行動。同時通過全身控制器確保動作的安全性和穩定性,保持機器人的平衡。

Figure,衆人看好的具身智能公司

人工智能的後半場,以機器人爲代表的具身智能將成爲新的智能增長點。

英偉達CEO黃仁勳曾說,“具身智能將引領下一波人工智能浪潮”。這樣的觀點正在被越來越多的公司所贊同。當前,生成式AI的競爭已經從連續對話走向長文本以及多模態,各家科技公司和機構也开始投資具身智能。

而這家名爲Figure的具身智能公司,除了被OpenAI看好,還拿到了多方的投資,成爲了硅谷備受關注的新星。

公开資料顯示,Figure成立於2022年,成立之初就瞄准了通用人形機器人領域。在3月1日,它宣布完成了驚人的6.75億美元B輪融資,公司估值達到了26億美元。而它的投資方,幾乎佔據了硅谷的半壁江山。除了OpenAI,微軟、英特爾、英偉達、亞馬遜創始人貝索斯以及“木頭姐”等,都是它的投資方。

而在獲得融資之後,Figure也沒有讓人失望。在今年1月,它們的產品Figure就通過端到端神經網絡,僅用10小時就掌握了制作咖啡的技能。1個月後,它又展示了把箱子搬運到傳送帶的新技能,而現在,它又學會了理解人類的意圖。

當然,在商業化的道路上,Figure也在積極探索。目前,Figure已經和寶馬制造公司籤訂了商業協議,Figure 01已經开始在寶馬位於南卡羅來納州斯帕坦堡的汽車工廠接受測試。

從ChatGPT到Figure 01,OpenAI想的依舊是AGI

盡管OpenAI在2021年夏天悄悄關閉了其機器人團隊,但顯然,OpenAI對於機器人領域的關注並未減少。

除了Figure,OpenAI在一年之前就投資了挪威一家名爲1X Technologies的機器人制造商。與此同時,OpenAI還被彭博社爆料,說它投資了一家新成立的機器人AI公司Physical Intelligence,他們的創始團隊分別來自谷歌研究團隊、加州大學伯克利分校以及斯坦福大學教授等。而這家公司也是研究未來能夠成爲通用機器人系統的人工智能。

顯然,將OpenAI大模型融入Figure 01是OpenAI有意的战略布局。

對於計算機視覺、機器人等領域來說,具身智能是一個很有挑战的目標:如果AI智能體(機器人)不僅能夠接收來自數據集的靜態圖像,還能夠在三維的世界中,無論是虛擬還是真實的,四處移動並與環境進行交互,那么我們將能迎來一次重大的突破,即從識別圖像等機器學習的簡單能力,轉變到學習如何通過多個步驟執行復雜的類人任務。

而當機器人能夠執行類人任務後,通過數據的迭代升級,將會越來越像人。而到了那個時候,也許AGI能夠取得突破,這也是OpenAI一直以來的目標。

一年之前,OpenAI發布了GPT-4,向世界證明了大模型的威力,而在一年後的今天,Figure 01的表現,也許會是機器人領域的GPT-4時刻。不過,正與OpenAI爭得不可开交的馬斯克,他的Optimus也是機器人領域的佼佼者,這兩者之間還會有什么樣的故事,我們拭目以待。

       原文標題 : 新火種AI|GPT-4誕生1年,OpenAI把它放到了機器人上



標題:GPT-4誕生1年,OpenAI把它放到了機器人上

地址:https://www.utechfun.com/post/346204.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡