隨着人工智能技術的發展,相比上一個 IoT 時代,如今的 AIoT 或將爲我們帶來更多的想象空間。衆所周知,生成式 AI 一直在爲各行各業注入新的動力,以 AI 爲載體的智能硬件行業自然也不例外。更智能的多模態大模型賦予了智能硬件更多的可能,全新的人機交互體驗和智能化變革正在進階。
在剛剛過去的 RTE2024 IoT 專場上,聲網 IoT 行業負責人吳昌儒、海馬爸比聯合創始人譚國豪、小米 XiaomiVela 开源負責人杜超、蓮偶科技軟件部總裁楊旺、曠視增值業務部總經理史澤鴻、佐臻技術總監徐偉恩等行業大咖齊聚一堂,分別從不同角度分享了 GenAI 對智能硬件的創新驅動,以及 AIoT 時代下全新的技術趨勢和場景實現。
AIoT 時代,人機的交互方式將如何變革?
1960年,命令行界面( CLL )交互方式出現,人們通過鍵盤輸入命令與計算機進行交互。1980年,圖形用戶界面( GUI )出現,圖形元素與計算機交互成爲主流。2010年,iPhone 誕生开啓了觸摸交互時代,點擊、拖拽和手勢操作等交互方式使人機交互更自然。2020年後,語音/多模態/對話式( LUI/MUI/CUI )交互方式逐漸成熟。今年,OpenAI Realtime API 發布標志着實時交互又取得了重大進展,人與AI的溝通將變得像人跟人之間一樣自然。
有了多模態、對話式交互和大模型之後,以大語言模型( LLM )爲核心引擎的模擬人類智能行爲系統 AI Agent 也爆火,它的優勢是可以通過對環境的感知、做出決策並執行任務,以實現特定的目標。聲網 IoT 行業負責人吳昌儒表示,隨着 AI 技術的快速發展,AI Agent 硬件產品正在百花齊放,並爲各個領域帶來了全新的智能化體驗。這些產品不僅可以借助人工智能實現高度自動化和個性化,還能通過硬件設備與用戶進行自然交互,智能硬件+ AI Agent將帶來真正的場景升級。
從當下的市場情況來看,目前智能硬件+ AI Agent 主要的應用方向有兩個,一是提高生產力的工具,二是帶來情感陪伴。吳昌儒認爲,智能硬件+ AI Agent 將推動 IoT 領域從一次性硬件銷售到長期服務提供的商業模式轉變,廠商未來可以通過訂閱和增值服務的形式獲得持續的收入來源。
他還介紹到,聲網爲了更好的解決 AI Agent 所帶來的實時互動問題,此前就推出了聲網 AI Agent x IoT 智能硬件解決方案,該方案能夠在低功耗、低算力芯片上快速實現大模型的接入,具備低延時實時互動、低成本靈活適配的特性,通過豐富的功能在智能硬件場景中構建真實、自然的 AI 語音交互體驗。目前,聲網 AI Agent x IoT 智能硬件解決方案已經提供了包含大網實時傳輸,音頻處理、語音識別、文本處理、視頻處理等能力,可以支持智能管家、安防助手、虛擬陪伴、生活助理、實時翻譯等應用場景。
小米在 IoT 操作系統領域的探索與實踐
說到 IoT 領域的發展,一定繞不开小米。數據顯示,目前小米 IoT 可連接設備數已經達到8.22億,米家 APP 月活9690萬,擁有5件設備及以上的用戶數1610萬。無論從規模還是活躍程度上講,小米 IoT 都稱得上是全球領先的消費級 IoT 平台。那么,在小米的視角下,AI + IoT 會帶來哪些新的進化?
小米 XiaomiVela 开源負責人杜超認爲,IoT領域核心痛點就是碎片化。他介紹到,爲了解決碎片化這一問題,小米在2017年就啓動了 Vela 自研操作系統的研發,目標就是爲了打通碎片化的 IoT 應用,並在各種不同的硬件平台上提供統一的軟件服務,爲 IoT 的繁榮構建基礎設施。
經過幾年的發展時間,目前 XiaomiVela 已經在智能穿戴和智能家居領域超5千萬台設備中得到了應用。其具備的柔性部署、跨端互聯、端側 AI、安全保障和开發者生態五大優勢可以讓設備廠商以最低的研發投入、最短的研發周期成功地开發出高體驗的智能產品。
杜超表示,AI 與 IoT 的相互結合將爲大家帶來超乎想象的智能體驗。今天的 IoT 設備已經不再局限於個人,更廣泛的家庭使用場景促使着服務要觸達更廣闊群體、並滲透人車家的全生態場景之中。AI 在這個趨勢中的價值空間很大,它不僅可以用於洞察各種生活場景,精准的捕捉、剖析用戶的意圖,還能通過多應用的智能編排,促進多設備、多應用之間的無縫協同。
未來,通過 AI + 快應用的創新模式,將有望實現從基於用戶指令的傳統應用到基於用戶意圖主動服務的根本性轉變,徹底重塑跨端體驗。
雲端一體,爲硬件產品注入智慧基因
作爲一家聚焦物聯網場景的人工智能公司,曠視對 AI +IoT 的未來發展有着深刻的洞察與諸多實踐。在RTE2024 IoT 論壇上,曠視增值業務部總經理史澤鴻帶來了題爲“雲端一體,爲硬件產品注入智慧基因”的分享。
據史澤鴻介紹,曠視作爲人工智能行業的務實者和領跑者,一直以涵蓋算法、系統和硬件的全棧式技術能力,持續爲行業用戶提供基於大模型的端到端解決方案,並全面擁抱 AI 新浪潮。在硬件方面,曠視集中在偏傳感器類和機器人類的硬件產品的研發。在系統上,自研AI生產力平台 Brain++,可以讓大模型落地效率更高、成本更低。在算法上,曠視在通用大模型和行業大模型兩個方面一直持續積累,並推出了曠視太乙大模型和算法生產平台 AIS 。在 AI 硬件上,也持續在芯片傳感器和機器人硬件方向上投入和實踐。
應用落地上,1套 Brain++算法支撐系統、2個曠視 AIoT 平台與曠視 AI 算法服務平台以及一系列嵌入式模組硬件,共同組成了曠視1+2+N 的雲端一體解決方案。
史澤鴻也在現場着重介紹了可以實現產品快速搭建的曠視 AIoT 平台。據悉,曠視 AIoT 平台可以集中進行設備、數據,本地算法應用、雲算法應用、大模型應用的綜合管理,並爲客戶提供私有雲集成,快速完成 APP 小程序和設備的一站式連接,依托聲網的能力,該平台已經可以實現更低延時的視頻體驗和算法的散發體驗。
AI 助力硬件新消費升級:嬰兒看護、空間手勢交互、智慧眼鏡
從交互設施的改變、跨端體驗的重塑再到雲端一體,我們看到了 AIoT 時代的基礎設施構建與技術變革。在實際的應用層面,也有多位從業者帶來了不一樣的進化展示。
先從海馬爸比开始說起,對於從事邊緣計算的企業來說,如何與大模型做更好的結合,並提供更好的產品體驗在 AIoT 時代顯得尤爲重要。以海馬爸比嬰兒看護神器爲例,目前該產品在 AI 技術的支撐下,已經具備 AI 遮臉提醒、哭聲檢測、睡眠監護等功能。未來通過 AI 技術,這類產品不僅可以成爲家庭育兒助手,還能根據每個孩子的具體情況量身定制教育內容,使其更加智能化和人性化。
在海馬爸比聯合創始人譚國豪看來,AI 在未來對硬件消費領域的賦能將是全方位的。個性化互動方面,AIGC 技術可以通過分析用戶數據和行爲,生成符合個人需求的內容,讓設備更具人性化。例如,智能硬件中的AI能自動生成音樂、故事或互動遊戲,主動安撫或幫助孩子學習。情感與需求識別方面,AI +智能硬件能夠生成適合特定情緒或需求的內容,並根據孩子的情感生成個性化的語音對話,主動改善用戶的情緒狀態。
譚國豪認爲,AIGC 正在引領智能硬件變革,AI 不再僅僅是被動監測和響應,它將通過生成有意義的內容與用戶互動,推動智能硬件從工具轉向服務。
直播作爲當下最熱門的行業之一,有沒有可能通過AI +智能硬件形式幫助從業者打破語言壁壘、創新交互玩法?蓮偶科技軟件部總裁楊旺在 RTE2024 IoT 論壇上展示的 L-Ring 2 就是一個很好的例子。
據介紹,手勢算法驅動、AI 能力算法賦能的最新空間戒指 L-Ring 2,是蓮偶科技在 AR 和硬件結合領域的一次探索。L-Ring 2不僅可以爲直播場景提供精准的語音識別和實時的語言翻譯能力,未來還將結合聲紋模擬語音合成、情緒模擬、口型視頻合成等技術,讓直播翻譯更自然,更流暢。在交互玩法上, L-Ring 2可以通過手勢輕松交互,擺脫觸屏與手柄,提升用戶體驗。
不可否認的是,演示講座、大空間交互、實時操控、智駕操作、直播互動正在成爲空間手勢實時交互的應用場景。楊旺也表示,未來手勢識別算法結合 AI+RTE ,將爲直播平台提供增強實時互動的融合解決方案。蓮偶科技作爲一家深耕大空間科技領域的公司,將持續結合 RTE、空間算法、手勢識別算法、AI 大模型等技術,致力於實現現實與虛擬世界的無縫融合,爲用戶提供更加沉浸式的互動體驗。
除了嬰兒看護、空間手勢交互這類產品之外,以VR / AR 爲代表的 XR 技術近年來也出現了井噴式發展,並在各個行業得以廣泛應用。當 XR、AI 與物聯網整合在一起之後,又將發生怎樣的變化?
在現場,佐臻技術總監徐偉恩重點介紹了佐臻推出的 AR 眼鏡。他指出,該款眼鏡可以打破時間和空間上的隔閡,增加人、物、空間和數位內容之間的連接,已經被應用在了智慧醫療、教育和智慧樓宇等場景中。除此之外,徐偉恩還分別介紹了包含 XR 展廳和展覽、沉浸式模擬、遠程協作、5G 直播在內的佐臻遠程多人協作方案。在多種應用場景中,專家端都可以透過實時互動技術在线協助現場端的問題,真正實現實時異地同工。
在徐偉恩看來,XR 不單只是一個技術,更是一個改變。它將 Gen AI 的潛力釋放到全新的境地,讓人們在虛擬和現實之間,更智能化的探索無限可能。兩者的結合在未來各種領域、產業發展帶來創新和改進、持續發揮無限潛力。
不得不承認,在 GenAI 的浪潮下,AIoT 時代正在快速到來。全新的時代,人機交互的形式會變、產品商業價值會變、盈利模式會變。但不變的是,聲網期待與各場景、各領域從業者一起共迎接新時代、擁抱新技術的初心。
原文標題 : RTE2024 IoT 專場:全新人機交互方式提升智能硬件體驗
標題:RTE2024 IoT 專場:全新人機交互方式提升智能硬件體驗
地址:https://www.utechfun.com/post/442151.html