群體智能,加速現實“科幻化”

2024-09-27 18:40:05    編輯: robot
導讀 設想一下,在未來世界裏,人工智能(AI)能夠像人類一樣閱讀、交流,甚至在各種環境中自主學習和成長。但現在這已不再是科幻小說的專利,而是RockAI(巖芯數智)的端側大模型正在做的事情。 植入Yan1...

設想一下,在未來世界裏,人工智能(AI)能夠像人類一樣閱讀、交流,甚至在各種環境中自主學習和成長。但現在這已不再是科幻小說的專利,而是RockAI(巖芯數智)的端側大模型正在做的事情。

植入Yan1.3多模態大模型的無人機、機器人、PC等各類終端,可以實時識別環境、准確理解用戶的模糊指令和意圖,像人一樣進行思考,並據此控制其機械軀體高效完成各類復雜任務。

在全球數字化轉型浪潮中,端側大模型正以高效、安全、個性化等特點,展現出巨大的應用潛力和市場需求。

“真端側”最強大腦

9月26日,RockAI(巖芯數智)發布了Yan1.3多模態大模型,即群體智能單元大模型,能夠在高中低等不同算力設備上無損運行。

相較於今年1月首發的Yan1.0大模型,Yan1.3具備了強大的多模態能力,可高效處理圖文及語音等多模態信息。此外,Yan1.3進一步優化了底層神經網絡架構,並以基於仿生神經元驅動的選擇算法達成模態分區激活,實現了大模型在更廣泛設備端上的離线無損部署,即便是普通電腦的CPU上也能流暢運行。

在智能能力方面,3B參數的Yan1.3大模型,其表現已經超越了8B參數Llama3的性能水平,具備更低算力消耗和更高效訓練及推理效率。

RockAI還演示了Yan1.3多模態大模型在無人機、機器人、PC等各類終端上的超強能力。

以飛龍無人機爲例,區別於大多數雲邊端協同控制的無人機,飛龍無人機的智能大腦Yan1.3直接部署於設備端,對關鍵信息及突發狀況能做出即時判斷和處理。同時,其多模態處理能力能夠像人一樣“聽、說、看”,在城市治理及工業應用方面,部署了Yan1.3的飛龍無人機可支持各類環境下的智能巡檢,高效適配電力巡檢、安全監控、環境監測等復雜場景。

RockAI介紹,與某廠商合作的無人機項目可以解決5G-A成本高的痛點。通常無人機拍攝收集到的畫面畫質較高,爲了快速響應,一般會使用5G-A的方式傳回飛控中心,這也導致高昂的流量傳輸費用。在將Yan1.3模型部署到無人機後,設備可自行判斷哪些信息是值得傳回匯報的,哪些是可以自行處理的,降低成本並建立生態。

面向個人用戶的飛龍無人機同樣大有用處,可廣泛運用於AI拍攝、旅遊、山地越野等戶外場景,在勘探環境、規劃行程的同時,還能夠解放雙手,做“拍照搭子”,自動捕捉最佳角度並挑選出最佳照片。

據了解,群體智能來源於對以螞蟻、蜜蜂等爲代表的社會性昆蟲的群體行爲研究,主要指通過多個個體的協作和交互,形成的集體智慧和決策能力。群體是去中心化的,具有自組織性,通過個體間的信息共享和集體行動來做出決策或完成任務。個體的智能化程度越高,群體智能的表現能力越強,繼而反哺群體中的每一個體,使得其智能水平提升。

RockAI借鑑了生物界的群體智能,形成了以Yan架構打造群體智能單元大模型的技術路线,爲每一台設備注入屬於自己的智能基因。

端側AI浪潮來襲

端側AI的興起,是技術與市場需求雙重推動的結果。在雲端大模型日益復雜的背景下,高昂的算力成本、數據隱私安全的考量以及個性化服務的迫切需求,共同催生了端側AI的發展。

端側AI大模型是指運行在設備端的大規模人工智能模型,通常部署在本地設備上,如智能手機、I0T、PC、機器人等設備。相較於傳統的雲端AI大模型,端側AI大模型的參數量更小,能夠減少對網絡的依賴,保護用戶隱私,同時降低數據傳輸和處理的延遲。

在過去幾年間,端側AI經歷了從理論探索到實際應用的轉變,目前全球範圍內的端側大模型發展迅速。去年上半年,谷歌推出了可在移動設備上離线運行的PaLM2輕量級模型“壁虎”, 打響了端側大模型“第一槍”。

此後,法國創企Mistral AI發布Mixtral 8x7B模型。微軟緊隨其後,推出了高性價比的Phi-3系列小語言模型。Google的Gemma模型與Meta的Llama-2大模型形成競爭態勢,蘋果也在積極推進端側AI的發展。

國內廠商,如面壁智能推出的MiniCPM-Llama3-V2.5和商湯的SenseChat-Lite,都在端側AI領域展現出強大的競爭力。

盡管端側大模型具有多重優勢,但其部署仍面臨諸多挑战,尤其是模型量化、壓縮、裁剪等帶來的性能損失和學習能力受限問題,更有可能直接導致卡住不動、死機等運行不穩定的情況。

例如,大熱的AIPC就是把Transformer架構的模型通過量化壓縮部署到了個人電腦,而70億參數的大模型還需要定制的PC芯片提供算力。因此,如何在保證精度的同時提高模型的效率,是端側AI走向落地應用的一大障礙。

隨着技術進步和市場需求多元化,端側AI不再僅僅追求輕量化和低功耗,而是向着高效、個性化和安全可控的方向發展。

在這場風起雲湧的革新浪潮中,RockAI以獨樹一幟的創新技術與實踐,爲端側AI走向更廣闊的應用場景开闢了新路徑。

面對端側AI的挑战,RockAI採取的策略核心在於徹底革新傳統架構。今年1月,RockAI發布的Yan1.0模型,是國內首個非Attention機制的通用大模型,它摒棄了Transformer架構,採用計算量更小的Yan架構,不僅在模型效率和成本控制上取得突破,而且在推理吞吐量上實現了顯著提升。

經過迭代,RockAI在7月推出的Yan1.2大模型可以“原生無損”地以6+tokens/s的速度運行於算力僅普通電腦八分之一的樹莓派上。

在樹莓派等低端設備上的成功運行,證明了RockAI的端側模型可在保持高性能的同時,適應更爲廣泛的硬件環境,實現真正的“爲設備而生”。

更關鍵的是,RockAI的端側大模型還將用戶隱私保護和個性化服務提升到了新層次。在AI技術日益普及的今天,用戶對數據隱私的關注達到了前所未有的高度。RockAI的端側部署策略,讓數據處理發生在本地,極大增強了用戶數據的安全性。

近年來,隨着計算能力的提升和AI技術的發展,端側AI开始在智能手機、智能家居、自動駕駛等領域發揮重要作用。RockAI也在加速推動端側AI的商業化進程,探索端側大模型的適配和應用。

跨域融合深度賦能

RockAI選擇設備端是爲了探索模型的下限,證明其在中低端設備上的運行能力,同時實現大模型的商業化落地和普惠。因此,一开始就選擇了在算力極低的樹莓派上部署Yan模型,而後面一些設備端適配的需求則大多來自合作夥伴和客戶。

例如,胖虎機器人具備強大的多模態認知能力,可在離线的情況下准確理解模糊指令,並由Yan1.3“大腦”控制軀體高效完成各類復雜任務,展現“七步成詩”、“詠春拳法”等。該機器人搭載的核心硬件是以低算力著稱的樹莓派第五代芯片,在極低算力的設備上實現了強大的多模態能力。目前,RockAI給文娛企業做的導覽機器人,具有引導介紹、場景描述、問答自由交流等基本功能。

RockAI現場展示的迅兔智能助手(AIPC)可以在離线模式下聽懂“人話”、看懂圖片並快速搜圖,准確完成“幫我錄音並整理會議記錄”“把所有橘貓圖片都刪掉”等模糊指令,保護用戶隱私安全的同時,精准理解所需內容。

在今年7月舉行的WAIC 2024上,RockAI研發的智能機器人“小智”,也展示了令人驚嘆的多模態交互能力。例如,對於“讓一讓,我要放東西”這樣的模糊指令,小智能夠識別並做出避讓動作。甚至對於需要大腦和軀幹協調完成、復雜程度翻倍的任務,如“在四步之內創作出以楓葉爲主題的一首古詩”這類復雜任務,也能出色完成。

這些能力的背後,是RockAI在將大模型無損部署到端側設備的過程中,除了對大模型基礎架構進行“破壞式”創新,還採用了多種突破性技術手段。

RockAI首創了“同步學習”理念,這一機制允許模型在推理過程中即時學習和更新,無需“返廠”進行再次更新或預訓練,從而使得大模型可以像人類學習一樣建立自己獨有的知識體系。

RockAI的這一突破有望爲端側AI大模型賦予“自主學習”的能力,讓每個設備都能根據用戶需求和環境變化進行實時優化,形成真正意義上的個性化智能。

爲了實現樹莓派等更多更低端設備的無損適配,RockAI基於自研的Yan架構,進一步尋找人工神經網絡最底層的反向傳播算法的更優解,力圖實現Yan模型的降本增效。

同時在算法側,受人腦神經元分區激活的啓發,採用基於仿生神經元驅動的選擇算法,實現了類腦分區激活的工作機制,使大模型可以根據學習的類型和知識的範圍分區激活,減少數據訓練量,發揮多模態的潛力。因此,當模型迭代到1.2版本,已經可以實現在PC端、手機端、樹莓派端和機器人端等設備上的無損運行。

在未來的應用場景方面,我們可以進行一番設想:在智能家居領域,端側AI可以融入家庭設備,根據家庭成員的習慣和需求,實時學習和調整設備的運行模式,實現智能化的家居控制;在教育領域,端側AI可以成爲學生的學習夥伴,根據學生的學習進度和特點,提供個性化的學習內容和指導;在醫療領域,端側AI可以輔助醫生進行診斷和治療,通過對大量醫療數據的學習和分析,爲患者提供健康管理和康復指導等。

可以預見,RockAI的端側AI機器人及其背後的Yan系列大模型,正在以強大的技術創新能力和跨域融合優勢,爲智能設備提供“大腦”,爲“人工智能+”深度賦能各行各業做准備。

加速群體智能湧現

以往,群體智能的發展方向更多是簡單的智力組合,疊加形成的是一種隨智能體數量呈线性增長的群體智能。比如,利用多個無人機的拼裝組合,來提升原本單個無人機的裝載能力等。

而當前,RockAI所尋求的群體智能更多是智力協同,強調不同個體的特長互補,組合在一起形成的協同效應可使群體智能呈指數級增長。因此,RockAI的目標是致力於打造群體智能,而非OpenAI等公司傾向的“造神式”超級智能。

RockAI CEO劉凡平表示:“群體智能才是通往通用人工智能的關鍵路徑,因此RockAI以Yan架構打造群體智能單元大模型,不單是爲了提升某個設備的能力,更是爲機器注入一種新的、本質性的智能基因,使其擁有超強的環境適應力和自主學習能力。屆時,每個部署了Yan模型的設備都將成爲一個智能單元,通過它們的不斷協同、交互,最終激發群體智能的湧現。”

當群體智能發生後,人與機器之間的協作方式就會發生更大變化,使機器服務於人類去做更多事情,同時機器與機器之間也可以協商如何完成任務,而不是一台機器去完成,所以群體智能未來可能打开的東西比想象中更多。

在一系列技術革新與應用探索的背後,RockAI不僅在技術層面實現了突破,更是在商業應用和生態構建上重新定義了大模型在智能時代的核心價值。

目前,RockAI已在B端業務落地,拓展Yan架構大模型在醫療、金融、能源、通信等重點領域的落地及深度賦能。同時,Yan模型商業化的重心正逐漸從B端部署到C端,以軟硬件結合的方式搶佔C端藍海市場的先機。

基於Yan架構大模型“無損適配”全线終端設備的核心優勢,RockAI也與芯片廠商及終端廠商達成初步合作意向,突破硬件限制,打造越來越多基於Yan架構的智能單元,讓更多消費者能夠平等地享受到“真正的端側智能”。

對於Yan模型的未來,RockAI希望以Yan架構爲基礎打造通用人工智能操作系統,讓Yan模型成爲像Windows、Android或IOS一樣的存在,使所有开發商都能基於此开發應用。

當Yan模型部署到智能手機、機器人以及其他多樣化設備後,會更像每個人的貼身伴侶,伴隨着個人的習慣去進行學習和服務,越來越具備個性化的價值,讓手機、電腦、電視、音響等智能家居都能展現出更強的適應力與高度個性化的交互能力,個性化適配到每個人,最終形成諸如群體智能等可交互的多樣性智能生態。

與此同時,同步學習的深入實施、全模態融合的挑战以及如何在保持個性化的同時確保數據安全和隱私保護等,這些也都是RockAI未來需要攻克的難關。但也正是這些挑战,構成了人工智能進化的動力,推動着RockAI和整個行業不斷向前,一個更加智能、更加個性化的AI時代正悄然來臨。

       原文標題 : 群體智能,加速現實“科幻化”



標題:群體智能,加速現實“科幻化”

地址:https://www.utechfun.com/post/426008.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡