盡管2023年才過完了一半,但來自AI領域的科技震撼卻沒有要結束的意思。回顧過往,AI從沒像今天這般那樣受人矚目,似乎一夜之間,它就成了新的科技方向。
當然,眼下大家所談及的AI,更多是以Chat GPT爲代表的,一種基於人工智能技術驅動的自然語言處理工具。它能對話,能畫圖,能勝任各種工作;它懂邏輯,擅推理,甚至可以解讀人的情緒和態度,如此種種,一步步填補了我們對真實AI的向往。
AI在拍照中的應用
其實聊到AI,大部分用戶都不會陌生。我們每天手機不離手,而大家最开始接觸AI應用,很多都是來自智能手機,其中最具代表的當屬手機影像了。
在手機拍照過程,AI的作用稱得上立竿見影。以小米13爲例,當我們進入到相機界面,在下拉菜單項中,會有一個“AI相機”字樣的選項。
开啓AI功能後,我們會發現照片的色彩更明豔,飽和度更高,亮度也有所變化。有了這個功能,當你按下快門的那一刻,手機就會根據此時此刻的拍攝場景自動計算出最優方案,從而直接“P”出一張成片,省去了後期的步驟。
如果只是做到這一點,顯然是不夠的。隨着智能手機AI能力的變化,在手機影像上,有AI參與的場景可以說是越來越深入,越來越頻繁。
其中,夜景就是一個十分典型的場景。衆所周知,CMOS的面積越大,進光量就越多,夜景照片成像質量自然就越好。但受限於機身的尺寸,手機內部很難塞下更大尺寸的傳感器和光學鏡頭,光线越復雜,圖像就容易產生噪點,看上去很模糊,手機拍夜景就會顯得愈發力不從心。
但事實上,我們發現手機拍攝夜景其實是很能打的,甚至不輸一些專業設備。爲什么會這樣呢?答案一目了然,自然還是與AI有關。
有了AI參與之後,手機拍攝的夜景照片就不再是單次曝光所得,而是連續拍攝多張不同參數下的照片,然後進行堆棧,進而合並成一張樣張。這個過程還是比較復雜的,但利用AI可以快速找出樣張中的特徵點進行校准,再將多幀畫面進行合成,有效去除噪點以及提升畫面細節。
除了AI模式、夜景模式等基本應用外,隨着AI能力的提升,也衍生出了萬物追焦、疾速抓拍、魔法換天、背景虛化等進階應用,大大豐富了手機相機的玩法,提升了拍攝體驗。
萬物追焦
就比如萬物追焦,穩定精准智能可持續地追焦能力特別適合拍攝運動中的物體,如果家中有活潑好動的小孩子或者寵物,這個功能簡直不要太好用。
魔法換天
還有魔法換天,你可以給相冊中的照片編輯各式各樣的天空效果,拍不出星軌沒關系,可以後期一鍵生成,拍不到圓月也沒關系,一鍵生成一個就完事了,甚至還能一鍵加入閃電、落日、極光、銀河……不僅玩法新穎,看上去也是毫無違和感。
AI在日常生活中的應用
那么除了在拍照時,在日常使用時,又有哪些場景會用到AI呢?
其實還真不少,就比如在小米手機中,有一個很有意思的AI應用,可以說是我自己的最愛之一,它就是AI通話。
當有電話打進來時,我們無法接聽,但又不想錯過,或者總被營銷電話騷擾不勝其煩,遇到這種情況,“小愛通話”就可以幫助我們很好完成“接聽”工作。
對於MIUI用戶來說,大家對小愛同學並不陌生,但應該很少有人知道它還有這種用途。簡單來說,這就是一個基於AI技術的自動通話功能,接聽後,小愛會識別對方所說的內容,用AI語音進行回復,在通話結束後,還會把對話過程通過文本形式記錄下來,方便我們後期查看。
當大家追劇時,如果看到自己很喜歡的英劇美劇,卻發現沒有翻譯字幕,肯定就要遺憾錯過了。
同樣在小米手機中,用戶可以开啓“小愛翻譯”,找到“實時字幕”功能,這樣在觀看視頻就會實時生成雙語字幕。
實時翻譯
從實際體驗來看,它的翻譯速度和准確性都很高,基本不影響理解。而且不僅僅追劇,在线直播、視頻會議等場景都有不錯的表現,可以說是AI在實際用機過程中頗具代表性的一個應用場景。
其實AI在手機中的使用場景還有很多,比如AI輔助信號增強,通過AI偵測用戶手部使用習慣,可以更准確地偵測使用場景,從而實現更低的通話掉线率、更快的數據傳輸速率、更廣的網絡覆蓋和更長電池續航;還有智能語音助手、照片分類整理、AI視頻剪輯、面部解鎖等等,滿足了用戶用機過程中的各種需求。
手機上AI的來自哪?
不過,AI這么強大實用,但它也不是憑空而來的。我們前面談到的一系列AI用例都來自小米13,那么小米13的AI能力又來自哪裏呢?
這就要說到它所搭載的第二代驍龍8移動平台了,第二代驍龍8移動平台搭載了一顆專門面向AI計算的Hexagon處理器,和以往不同,這次高通不但爲Hexagon處理器設計了獨立的供電系統,它的架構也有所變化,使其能夠更好支持Transformer網絡在終端側的推理能力。
大家還記得小米13上的實時字幕功能嗎,它之所以能夠在本地呈現出快速准確的翻譯效果。也正是憑借Hexagon處理器硬件性能的提升,使得第二代驍龍8移動平台成爲了業內最先達到INT4精度的移動平台,與INT8精度相比,INT4帶來的是90%的AI推理性能提升以及60%的能效提升,這使得第二代驍龍8,在自然語言處理用例下,能夠實現4.35倍的AI性能提升。
除了Hexagon處理器外,在第二代驍龍8移動平台中,傳感器中樞能力同樣得到加強,實現AI性能的翻倍。一般來說,傳感器中樞主要承擔一些低功耗輕負載的任務,如大家熟悉的語音助手、視覺喚醒和圖片分類之類的。
而在第二代驍龍8中,廠商能夠圍繞傳感器中樞打造更爲豐富的應用場景,比如息屏狀態下也能快速掃二維碼,或者實時監測是不是有陌生人正在偷窺你的手機屏幕,並及時關閉消息通知等等。
在影像方面,第二代驍龍8移動平台在Hexagon處理器和ISP之間,增加了一個名爲“Hexagon直連”的物理連接,打造了移動行業首創的“認知ISP”,並帶來了“實時語義分割”技術。
“語義分割”可以對畫面中不同區域、不同元素進行單獨的渲染處理,比如區分拍攝主體和不同的背景,或者在人像拍攝中,對被拍攝者的皮膚和五官進行單獨修飾,它的處理過程是實時的,而且速度非常快,用戶按下快門後,就能立馬得到想要的照片,不用等待。
最後:
AI作爲近年來最火熱的一個領域,吸引了包括高通在內的許許多多科技公司的關注。如今,高通在AI領域已經走在了行業的最前沿,以驍龍移動平台爲代表的一系列產品正不斷刷新着移動端AI算力的新紀錄,並且除了智能手機外,高通在XR、汽車、PC、物聯網等領域同樣有着廣泛的布局,可以預見,終端側AI即將迎來新一輪的巨大變革,直至徹底改變用戶的使用體驗。
值得一提的是,高通在6月16日正式發布了《混合AI是AI的未來》白皮書,明確表示在雲端和終端進行分布式處理的混合AI才是AI的未來。另外,高通也談到隨着強大的生成式AI模型不斷縮小,以及終端側處理能力的持續提升,混合AI的潛力將會進一步增長,前景可以說是十分光明。
總的來說,無論從實際體驗上,還是白皮書中所闡述的,高通在終端側AI方面確實有很大優勢,而且要知道,全世界搭載驍龍和高通平台的已上市用戶終端有幾十億台,每年還有數億終端產品湧入。也正是得益於高通AI技術的支持,今天的手機、汽車、XR等等智能設備已經表現得非比尋常,假以時日,隨着終端AI能力不斷提升,打造一個觸手可及的AI世界,似乎也沒那么遙遠。
標題:手機上無處不在的AI,原來還藏有這么多祕密
地址:https://www.utechfun.com/post/227540.html