大模型+影像:智能手機“上春山”

2024-02-23 18:40:46    編輯: robot
導讀 這個春節假期,一首《上春山》火了。喫瓜群衆熱熱鬧鬧學了一個假期的“春山學”,了解了搶佔C位的各種技巧。 假期過去,开工大吉,手機行業开始搶佔今年的C位。那么問題來了,今年智能手機最大的機會點在哪裏?...

這個春節假期,一首《上春山》火了。喫瓜群衆熱熱鬧鬧學了一個假期的“春山學”,了解了搶佔C位的各種技巧。

假期過去,开工大吉,手機行業开始搶佔今年的C位。那么問題來了,今年智能手機最大的機會點在哪裏?答案呼之欲出,當然是AI大模型。去年下半年,手機廠商陸續推出端側大模型。春節剛過,OPPO發布了全新的AI战略,宣布進入AI時代。魅族宣布不再生產“傳統智能機”,全面擁抱AI時代。顯然,大模型就是手機行業的那座“春山”。

但根據“春山學”相關知識,跟着大家一起上山是不夠的,必須更上一層才能穩站C位。在大模型+手機的衆多結合點中,有一項能力是C位中的C位,妥妥的“真·春山無雙”——大模型+手機影像。

據說在這個春節,一线城市的寫真店紛紛轉變了商業模式。原本大家都是去拍寫真,店家負責拍攝和修圖。現在都是去拍AIGC照片,店家搖身一變爲AI提示工程師,用各種AIGC平台來實現用戶種種匪夷所思的需求。

回來對比照片,也不是比你這張光打得不錯,你這張P得更自然,而是你這張照片用的什么提示詞,你這張一看就模型泛化性比較強……

總之,AI之風正經由照相館、寫真店、小程序、APP,強烈地吹拂着我們的影像生活。

但是問題來了,這些強烈的AIGC影像需求,真的必須去线下店才能完成嗎?爲什么不能在手機端一鍵搞定?最近手機新品動輒搭載幾十億參數的端側大模型,它們闲着幹嘛呢?

事實上,手機裏的大模型肯定是闲不住的。目前擁抱AI大模型的手機,基本情況是大模型是大模型,影像是影像,但這種分裂局面必然會很快得到改變。

“大模型與移動影像”的融合賽道,是2024年智能手機行業最爲清晰的風口,也是手機廠商急切想要上,也必須上了就不能下來的,具有战略意義的那座“春山”。

大模型+手機影像,這座春山怎么上?我們來弄清其中的“春山學”問題吧。

六年之後,AI影像再上山

首先我們需要明確一點,那就是AI+影像絕不是什么新鮮事物,甚至很多人都已經習慣了AI與影像的結合。

這個概念开始受到業界重視,是早在2018年的時候。那一年4月,華爲發布了P20手機。這款手機利用麒麟芯片的NPU端側算力,首次在拍照中搭載了AI功能,能夠識別包括寵物、人像、風景、美食等19種場景,覆蓋500多個識別目標。在AI識別這些目標物後,會自動調整攝影模式和參數設置。

隨後,這種AI攝影模式一度爆火,成爲當時最具熱度的手機技術升級,並且逐漸爲全行業所接受。隨着幾年發展,AI影像變得越來越復雜,可識別物越來越多,並且加入了動態抓取、去除反光等AI能力,還與此後流行的計算攝影概念結合,成爲手機影像系統中的基礎能力之一。

但到這個層面,AI攝影的能力依舊有顯著的局限性。它對圖片的作用集中於“美化”,而不是“修改”和“生成”。我們也探訪過一些AI攝影相關賽道的开發者,他們很希望能夠利用手機的AI能力做出更具創意的應用,但端側算力和模型能力是主要的限制。

而伴隨着AI大模型的爆火,模型能力的關隘被突破了。在大模型的加持下,用戶可以對影像系統提出復雜的指令,影像系統也能夠更完整理解用戶交互邏輯與意圖指向。在能力上,大模型可以幫助完成高精度的圖像元素替換,甚至加入AI生成的影像。

或許可以這樣說,最初用戶聽聞AI影像概念的時候,腦海中設想的影像能力,其實是在今天才有可能實現的大模型影像。

伴隨着大模型能力落地手機,AI影像終於可以完成關鍵一躍,實現那些早就許下的諾言。

大模型,就是AI影像的必須上的那座山。

春山上,風景如何?

春節還沒過去,世界就感受到了來自Sora的視覺震撼。AI行業有句話,叫語言模型爲打榜,視覺模型能賺錢。機器視覺能力是讓用戶感受到AI魅力最快速也最有效的方案。

長期以來,手機影像可謂一卷再卷,卷無可卷,但用戶始終能做的只是拍攝圖片。AI大模型能力的加入,可以讓用戶獲得無門檻修改圖片,以及將AIGC影像與手機拍攝影像結合的能力。AI大模型+手機AI計算能力+手機影像系統的組合,極大拓展了手機影像的邊界,既繼承了手機廠商多年來的技術與供應鏈布局,同時還獲得了新的增長空間。

目前階段,這條賽道已經迅速鋪开。比如三星就通過圖片助手功能,讓用戶實現了移動圖片中目標,自動填充空缺,生成新圖片的能力,從而讓手機影像具備更大的構圖自由。

而OPPO Find X7系列則實現了通過AI大模型來提供AIGC消除功能。就像我們最近在廣告裏看到的那樣,用戶可以把春節聚會時不想看到的人從合影中消除,同時依靠AIGC補齊背景。目前,Find X7已經可以支持最多6個主體單獨提取。除此之外,OPPO還更新了AI超清合影功能,可以智能識別並增強合影中人臉的清晰度。

可以預見的是,接下來我們會看到大量基於AI大模型實現的影像功能,比如AI摳圖,AI替換,AI擴圖等。整體而言,大模型+手機影像會呈現三大發展趨勢:

1.AIGC內容與拍攝內容結合。AIGC的文生圖平台,在過去一年快速贏得了用戶青睞,將這種能力與手機本身影像能力融合,是AI手機賽道上最關鍵的爭奪战。

2.AI能力從應用側上移,與手機本身的影像系統結合。目前,AI大模型帶來的視覺能力,更多還是單獨的軟件應用。接下來,手機廠商會將這些能力上移到系統側,成爲產品本身的差異化賣點。

3.手機影像能力可以OTA。AI大模型的加入,一定程度上讓手機自身的影像能力成爲可升級,可迭代的軟件。讓手機自身的系統級能力也可以持續更新,持續運營,是AI大模型帶給手機的一種新變化。

總體來看,大模型與手機影像的結合,有着非常充沛的創意發揮空間,有源源不斷的可能性。想要抓住這個機會,客觀上將帶來手機廠商之間新一輪的技術競賽。

那座山,就是下一個战略高地

目前階段,還沒有廠商將“大模型+影像”這個概念旗幟鮮明地提出來,但這個概念以各種不同的名稱落地,應該已經爲期不遠。

需要注意的是,在端側部署大模型,以及發展出一些創意性的AI影像玩法都很容易,但要將AI大模型+影像真正發展爲長期賽道,構成品牌的用戶心智支點,那還需要廠商投入巨大的精力,來展开一場全新的智能手機行業競賽。

其原因在於,大模型+手機影像是一場名副其實的綜合考驗。它需要硬件側的算力配合,需要影像系統的支撐,同時也需要模型側的算法加持,更需要應用开發創意以及AIGC專屬的視覺審美。從務實到務虛,從底層硬件到頂層應用,大模型+手機影像的競賽近乎覆蓋了手機行業的每個層級。

而重點來看,搶佔大模型+影像的战略高地,需要手機廠商在三個方面集結重兵:

1.AI基礎設施更新。這個基礎設施包括了AI算力與AI算法兩個部分。涉及芯片能力,端雲協同能力,以及基礎算法能力。手機的AI基礎設施更新需求,也將帶動產業鏈展开新一輪洗牌。

2.AI應用的准確把握。AI大模型能夠手機影像帶來的可能性不是太少,而是太多了。如何在有限的算力條件下,給用戶最准確,最吸引人的AI影像應用,將成爲手機廠商面對的頭一道考題。

3.AI審美能力的建設。最近很多人注意到Sora團隊有專門的藝術人才加入。藝術與審美能力在AIGC時代非常重要。隨着產業發展,算法能力會趨同,審美能力的差異化則會暴露出來。手機廠商過去更重視的是設計能力,這與藝術表達、審美判斷等能力是存在一定差異的。構建屬於AI手機的新審美能力,是一項全新的賽事。

最後,說一個有點反常識的判斷:大模型+手機影像這座“春山”,其實還是很容易上的。其門檻遠沒有手機廠商宣傳得那么誇張,但如果你最近用心學習了“春山學”教材,就會知道真正困難的不是上山,而是賴在山上不下來。

如何把大模型+手機影像從一個年度噱頭,變成可以多年發展的長期賽道,甚至變成改寫產業格局的錨點,那才是真正的考驗。

不過好消息是,有春山可上至少證明了一件事:包裹手機行業的堅冰正在技術暖風的吹拂下开裂、消融。能否就此別冬入春,選擇權在從業者手中。

       原文標題 : 大模型+影像:智能手機“上春山”



標題:大模型+影像:智能手機“上春山”

地址:https://www.utechfun.com/post/335976.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡