2023年的科技圈什么技術最火,毫無疑問,我相信大部分用戶的回答都會指向——AI。
Chat GPT的到來引發了業內外廣泛討論,也引發了大家對AI發展的新一輪思考。當下,全球科技大公司都在積極布局AI大模型,不過實際情況是,大家的目光更多還是集中在了雲端,相較之下,終端側AI的發展則要稍顯落寞。
眼下AI正朝向擁有深度學習能力的方向發展,這對算力提出了更高的需求,縱使終端側對算力要求稍低一些,但面對日益復雜的計算,仍舊需要終端具備更強悍的AI計算性能。
作爲終端側AI的引導者,高通一直在積極推動生成式AI在終端側的發展。目前,高通AI技術(硬件、軟件、工具)正在賦能包括智能手機、XR、PC、平板電腦和汽車等等在內的一些終端產品。
6月16日,高通正式發布了《混合AI是AI的未來》白皮書,在這份文件中,高通不僅分享了對當下AI發展形勢的一些看法以及對發展趨勢的預測,同時也向外界闡明了自身的AI發展路线——混合AI是AI的未來。
高通認爲,隨着生成式AI正以前所未有的速度發展以及計算需求的日益增長,AI處理必須分布在雲端和終端進行,才能實現 AI的規模化擴展並發揮其最大潛能;雲端和邊緣終端如智能手機、汽車、個人電腦和物聯網終端協同工作,能夠實現更強大、更高效且高度優化的AI。
在技術溝通會上,高通技術公司產品管理高級副總裁Ziad Asghar向我們展示了高通在終端側AI方面取得的進展,以智能手機爲例,目前高通能夠支持Stable Diffusion這一超過10億參數的模型在終端側運行,並且在未來幾個月內,這一參數有望突破至100億,包括文本生成圖片、文本生成文本、文本生成視頻,甚至還有圖片生成文本、圖片生成視頻等方式。
相較雲端AI,高通方案可以在智能手機上完成,而且全程飛行模式,僅需15秒內完成20步推理,就能生成飽含細節的圖像。這裏有幾個值得關注的點,一方面,生成式AI用例完全在終端側運行時,用戶的數據將一直保留在終端上,沒有聯網的情況下也可以運行,不僅安全和隱私得到極大保障,終端設備也能提供十分豐富的應用體驗。
另一方面,它的處理速度很快,我們看到只有十幾秒,但是它需要的功耗和計算量卻要比雲端處理低很多,特別是功耗,只有幾毫瓦。
另外,在雲端處理器上訓練模型一般採用32位浮點運算,針對Stable Diffusion,高通所採用的是8位整數運算(INT8)。但在去年年底在第二代驍龍8移動平台上,高通已經進一步支持了4位整數運算(INT4)能力,與INT8精度相比,INT4帶來的是90%的AI推理性能提升以及60%的能效提升,這使得第二代驍龍8,在自然語言處理用例下,能夠實現4.35倍的AI性能提升。
如今,高通的AI能力正在賦能了一系列廣泛的產品,與此同時,利用高通AI軟件棧,开發者可以在高通的硬件上創建、優化和部署AI應用,一次开發,就可以將开發成果和經驗應用於其他使用高通技術和平台的產品上,加速推進混合AI成爲現實。
標題:生成式AI大火,終端+雲端才是真未來?
地址:https://www.utechfun.com/post/228077.html