導語:?形機器?將是下?代終端。具?智能機器?的出現才會是真正的「iPhone」時刻。
時至8月,火熱了半年之久的AI賽道,已儼然顯示出了降溫之勢。
可就在這個關頭,由號稱華爲天才少年——稚暉君打造的人形AI機器人——「遠徵A1」卻赫然登場,用一系列亮眼的特點,振奮了已顯冷淡的AI賽場。
舞台之上,這個邁着小碎步入場的機器人,引來了整個行業的關注。
而這個由智元機器人(Agibot)發布的具身智能機器人,之所以能在業內引起如此大反響,則是因爲其具備了最新的AI大模型能力。
根據稚暉君在發布會上展示的內容,靈巧自如的遠徵A1,不但能做家務、制備實驗樣本,甚至還能勝任看護老人這類需要“體貼”的工作。
那么,這個看似“面面俱到”的AI機器人,究竟是如何在不同環境中,勝任各種復雜工作的?
其所代表的AI+具身機器人賽道,是否真的代表了未來AI的方向?抑或只是像元宇宙那樣,成爲一個難以落地的“概念化”產品?
01 “人形”的必要性
在討論人形機器人的未來之前,有一個需要明確的問題是:爲什么人類總是傾向於將機器人設計成人形?
對於這個問題,稚暉君表示,原因就在於“從第一性原理出發,人形雙足機器人是人類環境中最爲通用的終極形態!”
換句話說,機器人要想真正進入人類的生活,就得適應各種爲人體形態量身打造的場景、設備、任務。
例如,具身機器人如果想幫人類操作儀器,抓握東西,那就必須具備人類那樣靈巧的手指;
如果它想在城市環境中,邁過各種樓梯、台階,那就得具備和人類一樣能彎曲的膝蓋。
而要想實現這樣的靈活性、協調性,就必須在機器人的硬件構成上,進行一系列重要的設計。在這方面,智元機器人較爲獨特的技術之一,就是諧波一體關節。
這是機器人的傳動裝置,用來降低轉速、增大扭矩等,相當於人類的「關節」。
一般來說,機器人的結構和關節,決定了它的自由度,
而自由度是指機器人的運動能力,也就是機器人能夠獨立控制的運動變量的個數。
自由度越高,機器人的運動越靈活,越能適應各種復雜的環境和任務。
目前,遠徵A1的自由度超過了49個,手部有12個主動自由度。
而相較之下,馬斯克的“擎天柱”人形雙足機器人全身有200多個自由度,手部27個自由度。
雖與世界頂尖機器人有着一定差距,但六個月的時間,能做到這個地步,也實屬可觀了。
而除了自由度之外,另一個衡量人形機器人的指標,就是其關節的“控制扭矩”,
控制扭矩主要決定了機器人的運動力量,也就是機器人能夠產生多大的轉動力來驅動關節和執行器。
如果類比成人類的能力,相當於人的肌肉力量,就是肌肉產生多大的推拉、舉起、扭轉等動作的能力。
在這方面,遠徵A1一體化自研的矢量控制驅動器,整體的控制扭矩可以容易地超過350Nm。
而這樣的控制扭矩,則是由智元機器人自研的PowerFlow關節電機造就的。
PowerFlow關節電機創新性的液冷循環散熱系統,可以有效地將電機內部產生的熱量通過液體傳導到外部的散熱器,從而降低電機的溫度和阻抗,提高電機的效率和穩定性。
這樣,電機就可以在更高的功率密度和扭矩下運行,而不會過熱或損壞。
同時,PowerFlow關節電機還採用了徑向磁通的外轉子電機方案。
因爲在這樣的方案中,轉子組件固定在內部,並且磁場方向沿着半徑方向分布,磁場能量更集中,繞組和鐵芯的散熱效果更好。
除此之外,遠徵A1在核心部件上的創新,還包括了指尖傳感器末端的視覺閉環,基於強化學習的運控算法等。
可以說,正是這一系列的創新,賦予了其自如、靈活的運動能力。
但如果想與傳統機器人拉开差距,僅僅有一幅靈巧的身軀是不夠的。
在AI技術日新月異的當下,一個具備高度智能的“大腦”,就成了具身機器人必備的組成部分。
02 更智慧的大腦
如果要爲傳統機器人,與當下新出現的具身機器人劃一個明確的分水嶺,那這樣的分水嶺,則無疑是大模型技術的應用。
傳統的機器人,指的是那些主要依靠預先編程和固定規則來工作的機器人,它們通常只適合於重復性、確定性和簡單性的任務,例如工業生產线上的裝配、搬運、焊接等。
在大模型興起之前,傳統機器人在執行各種復雜任務時,往往都存在着各種局限與短板。
例如:由於缺乏自適應能力,傳統的機器人很難應對環境和任務的變化,它們需要經常重新編程和調整,才能適應新的情況。
倘若要讓傳統的機器人從盒子裏取出一個物體,就必須事先告訴它盒子和物體的位置、形狀、大小、重量等信息,否則它可能無法完成任務。
而大模型與機器人技術的結合,則打破了這以往的限制與弊端。
具備強大的語義理解、邏輯推理、圖像識別的超大參數大模型,不僅可以讓機器人編排整個任務,還能動態調整任務。
比如,讓機器人把桌上垃圾扔到垃圾桶裏,不再需要告訴它垃圾是什么、垃圾桶是什么,所有的知識都來自預訓練GPT的模型。
憑借着龐大的先驗知識庫和通識理解能力,機器人就能原有的能力泛化到更通用的場景中。
除此之外,在稚暉君看來,大模型對於機器人最重要的價值,就是復雜語義多級推理能力,所謂的“思維鏈”。
例如,如果要讓一個機器人去廚房做一盤煎蛋,它就需要通過思維鏈來理解煎蛋的定義和制作方法,包括所需的原料、工具、步驟等。
同時,它還要分析當前的環境和狀態,包括廚房的布局、物品的位置,規劃出一條最優路徑。
最後,則是按照預設的程序或者實時的反饋,完成打蛋、下鍋等操作。
這種“思維鏈”能力,可以讓機器人通過一句簡單的指令,在真實世界中執行一系列復雜的任務。而這正是傳統機器人走向通用機器人的曙光。
也正因如此,遠徵A1除了可以在汽車產线中從事底盤裝配、外觀檢測等傳統工作外,一個最大的突破,就是具備了面向C端的陪護和照看功能。
在家庭場景中,遠徵A1,不但可以在烹飪場景中磕雞蛋,還能照顧老人、幫助老人喫藥,還能幫孩子輔導功課。
通過其強大的語義理解、邏輯推理、圖像識別等能力,大模型可以爲機器人提供一個統一和高效的思維鏈框架,使其能夠在海量的數據上學習通用和特定的知識、技能,並在不同的任務上進行遷移和泛化。
03 市場前景
那么,在具備了更靈活的運動能力、和更強的泛化性、通用性後,具身機器人的市場前景究竟如何?
或許,從各個科技巨頭對該領域的相關布局中,我們就可看到一些端倪。
2022年8月,特斯拉宣布將在該年特斯拉AI day上發布全尺寸仿生人形機器人Optimus 。
同月,小米全尺寸人形機器人CyberOne正式發布。宣傳片中,暱稱爲「鐵大」的機器?能夠獨立行走、彎腰,完成抓取等簡單動作。
而今年6月,騰訊發布了旗下機器人工作室Robotics X研發的四足機器人Max的最新視頻。
其自主研發的多模態四足機器人“機器狗Max”再度得到升級,動作、行爲都更加接近真實動物。
同樣的,近期華爲也成立了“極目機器”,布局機器人與智能制造,注冊資本8.7億,經營範圍包含電子元器件制造、工程和技術研究和試驗發展等。
種種跡象表明,衆多巨頭科技公司紛紛看好仿生機器人,行業正火熱發展中。
實際上,人形AI機器人的興起,並非僅僅是由於大模型的“火熱”所致,而是科技發展的內在規律。
正如個人終端從台式電腦到個人電腦,再到手機的發展趨勢一樣,每一代終端的迭代,都意味着人類將更多的功能,集合到了統一的平台中。
時至今日,手機幾乎成了這樣一個平台的終極形態,因爲其在一塊小小的屏幕中,集合了人們日常所需的購物、視頻、社交、學習等各種功能。
然而,人形AI機器人的出現,則填補了此前所有平台都無法彌補的空缺:即與真實的物理世界互動的能力。
也正因如此,巨頭們相繼推出機器人產品,並非趕熱點,而更多是之前即有的布局。
既然如此,在這場新的產業競爭格局中,各個入場玩家們的潛力和競爭態勢究竟怎樣?
此前,科技媒體量子位,從量產和資本能力兩方面,對目前行業內玩家及現狀進行了分析,並繪制了一個頗爲清晰的象限圖。
按照這樣的劃分,國內機器人領域的各個玩家,大致可分爲三個象限。
第一象限,主要是有強勁資本?撐的明星企業,如騰訊、小米和大疆等。這類企業,往往擁有雄厚的資金、技術,並且具備可觀的量產能力,可以在沒有量產壓力的情況下,不計成本研發原型機,推動行業技術發展。
第二象限,則是有潛力有技術的小型公司,這樣的企業通常都具有?校背景,並且產品專注於某一領域。如從機器寵物的角度切入的大象機器人,以及專注與航天、軍工等科研領域的鋼鐵俠科技。
而第三象限,則是產品未實現量產,但卻因資本於對其技術力的高度信任,而獲得大量投資的企業,如开篇提到的智元科技。
從這樣的產業格局來看,國內的機器人企業,已經涵蓋了從高到低,從2B到2C的完整生態鏈。
而在大模型的賦能下,一個可預見的產業趨勢,則是機器人會在2C端的服務領域,向着更多元的方向發展。
此前,清華?學交叉信息研究院教授陳建宇曾說:“人形機器?將是下一代終端。 具身智能機器人的出現才會是真正的「iPhone」時刻。”
在國內機器人百花齊放的生態下,具身機器人的發展,就像一場自然界充滿了未知與驚奇的進化,當參與進化的個體數量足夠多時,神奇的突變也終將會在某一刻顯現。
原文標題 : 具身智能,开啓機器人紀元
標題:具身智能,开啓機器人紀元
地址:https://www.utechfun.com/post/252483.html