作 者 | BT財經
來 源 | 德意志銀行了解更多金融信息 | BT財經數據通
在爆發全球熱潮前,人工智能是經過了多年酝釀的。爲了正確預測未來的人工智能創新,我們回到源頭,研究了人工智能應用的專利和風險投資交易活動。
我們收集了193個世界知識產權組織(WIPO)成員在2012年至2022年期間公布的175072項人工智能專利,分爲五大類。對於風險資本投資,我們使用了經合組織(OECD)人工智能數據庫2012年至2022年92個經濟體的24310筆交易數據。
按絕對值計算,自2012年以來,人工智能領域的風險投資活動和專利數量激增。期間,風險投資交易數量增加了10倍,達到3884筆,2022年的交易價值幾乎是2012年的50倍,達到830億美元。與此同時,人工智能專利數量在2022年增長了7倍,達到近3.7萬個。
從風險投資交易和專利來看,過去10年,超過三分之二的人工智能創新集中在交通、工業和消費等行業應用上。
接下來,我們預計生成式音頻(generative audio)將在2024年大規模出現,並顛覆遊戲和電影制作等行業。
1
人工智能走出冬眠
隨着OpenAI的ChatGPT於2022年11月發布,人們對人工智能的興趣激增,不僅是普通人,企業也是如此。2022年,公司文件中提到“人工智能”的次數超過71.5萬次,而2020年僅爲13.5萬次。根據我們的調查,到2023年4月,41%的美國人已經聽說過ChatGPT,而近60%的人表示他們的工作已經在某種程度上开始使用ChatGPT。
此外,在5月18日的新聞中,ChatGPT在美國發布了第一個應用程序版本後,現在可以在iPhone上使用。谷歌還於5月5日宣布,將开始推出集成到搜索產品中的生成式人工智能工具。在進一步研究之前,我們先對人工智能進行簡單的定義——人工智能是一種基於機器的系統,人類給出一組給定的目標,它可以作出預測、建議甚至決定,從而可能影響現實或虛擬環境。
人工智能其實已經酝釀了好幾年。自2012年以來,與人工智能相關的風險投資交易活動和已公布的專利一直在悄然飆升。例如,風投數量從2012年的332筆增長到2022年的3884筆。2022年,風投交易價值達到830億美元,高於2012年的18億美元。與此同時,自2012年以來,人工智能方面的專利數量增加了7倍。
人工智能行業的進入門檻一直在降低,這刺激了該領域的商業創新。例如,自2018年以來,圖像分類系統的訓練成本降低了64%,而訓練時間減少了94%。包括OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney和Cohere在內的衆多初創公司和風投公司也紛紛湧現。據報道,Anthropic最近在C輪融資中籌集了4.5億美元,參與融資的有Alphabet、賽富時(Salesforce)和Zoom。此外,一家倫敦的人工智能公司Builder. Ai在最新一輪融資中籌集了2.5億美元。
爲了正確預測人工智能即將到來的情況,我們還研究了該領域的專利。我們預計,獲得風投的公司大約需要兩到三年時間才能將產品推向市場,甚至需要更長的時間等待專利批准,如七至十年。就專利而言,在公司專利獲得保護後,他們則需要營銷,選擇商業夥伴等,這大概需要一到三年時間。
通過世界知識產權組織Patentscope,我們收集了193個該組織成員在2012年至2022年期間公布的175072項人工智能專利條目,這些專利分爲五大類,其中包括部門應用(sectoral applications)、服務平台(horizontal platforms)、自動化機器(autonomous machines)和半導體(semiconductors)。在風投方面,我們使用的是經合組織人工智能數據庫涵蓋的92個經濟體的24310筆交易。
1. 人工智能景觀——將創意帶入生活
股票市場反應如何
迅速採用ChatGPT和其他新的人工智能的公司股價飆升。例如,2023年1月31日,人工智能軟件企業C3. ai推出了集OpenAI、谷歌、學術研究等人工智能技術於一體的“生成式人工智能產品套件”。當日,該公司股價上漲近22%,自今年年初以來已累計上漲143%。
人工智能音頻和語音識別軟件公司SoundHound的股價今年迄今已上漲66%。
不僅僅是人工智能軟件公司,人工智能幾乎影響了價值鏈上的所有公司。英偉達是一家半導體公司,其生產的計算機芯片可以運行人工智能模型,該公司股價上漲了110%。在大型科技公司之間的人工智能競賽中,Meta也表現出色。
資金流向人工智能
2022年,全球對人工智能的風險投資達到830億美元的峰值,高於2012年的18億美元。Databricks和麻省理工學院發現,大多數公司已經开始廣泛部署人工智能。在樣本中,到2022年未使用人工智能的公司比例不到6%。
企業將從人工智能增長中受益
多年來,人工智能研究一直局限於學術界,如今正被應用於商業領域。學術界是先行者,從學術發表到獲得專利通常需要15年的時間。
然而,越來越明顯的是,人工智能創新爆發的時機已經成熟。從2012年到2022年,49%的風投交易是在過去三年達成的。同樣,我們的數據庫中有52%的人工智能相關專利在三年內發布。
2. 應用領域:人工智能將在2023年成爲主流
亞馬遜創始人兼執行主席Jeff Bezos表示:“我們現在正在用機器學習和人工智能來解決問題,現在發生的這一切猶如科幻小說裏描述的內容。”
過去10年,與人工智能相關的風投交易中,近五分之四是在行業應用領域。另有8%發生在自動化機器和汽車領域,還有13%發生在半導體領域。人工智能相關專利的比例也類似。
行業應用:人工智能不局限於一個行業
目前,79%的風投交易和61%的專利發生在我們認爲的“行業應用”中。根據我們的定義,這包括消費、工業、資訊科技、運輸、醫療保健、金融服務業。
從2012年到2022年,風投交易數量從270筆增加到3006筆,增長了10倍多。2022年,交易總額達到620億美元,遠高於2012年的13億美元。在這些領域發布的專利也在蓬勃發展。自2012年以來,相關專利數量增加了6倍。擁有最多專利的公司都是公認的科技巨頭,如IBM、三星(Samsung)、英特爾(Intel)、LG電子(LG Electronics)和高通(Qualcomm)。
服務平台:AI工具
自2012年以來,我們看到服務平台(horizontal platforms)的專利數量增長了近6倍,包括人工智能主核(AI core)、自然語言技術(natural language technology)、人工智能自動化平台(AI automation platforms)、計算機視覺軟件(computer vision software)。服務型應用(Horizontal applications)是人工智能开發和部署的重點模塊,擁有這類專利的公司包括AT&T、IBM、LG電子、百度以及老牌科技企業。
自然語言處理(Natural language processing)是一種用於大型語言模型(LLMs)的人工智能工具,隨着ChatGPT的出現而變得流行。自然語言處理的一些例子包括翻譯、自動糾錯、自動文本摘要、聊天機器人,以及金融領域的信息需求等處理方式。
計算機視覺涉及使用人工智能來分析視覺數據,並做出有意義的預測,包括面部識別、地理空間分析等。
微軟的Inner Eye技術已經可以幫助檢測腫瘤和異常細胞。在他們的最新研究中,微軟展示了其技術如何幫助臨牀醫生。在計算機視覺專利數量最多的五家公司中,有兩家是中國公司,分別是百度和華爲。
誰還需要駕照?自動駕駛已經到來
在過去十年中,8%的風投交易和16%的專利都發生在“自動化機器”領域。這類技術涵蓋兩個關鍵領域,分別是自動駕駛汽車和智能機器人。在過去的十年裏,這個領域受到了很多關注。這在很大程度上與特斯拉取得的成功相吻合,特斯拉一直在試驗自動駕駛汽車系統。
從2012年到2022年,自動化機器領域的風投交易數量從22筆增加到363筆。智能機器人就屬於這一類。這些機器人能夠在不需要人類幹預和輸入的情況下進行一定程度的操作。人工智能通常用於協助機器人機型訓練和適應。三星、LG電子、英特爾以及中國的大疆公司和滴滴等公司在機器人專利方面地位穩固。
幾年來,自動駕駛汽車也一直是人們討論的焦點。除了特斯拉之外,其他公司也在擴大對自動駕駛汽車所需技術的研究和投資,因此,風險投資和專利申請的大幅增加很可能是在這個背景下發生的。
半導體芯片
英偉達首席執行官黃仁勳表示:“很明顯,人工智能將影響每一個行業。我認爲每個國家都需要確保人工智能是其國家战略的一部分,每個國家都會受到影響。”
半導體佔人工智能相關風投交易的13%,佔已公布專利的4%,包括處理器設計(processor design)、邊緣人工智能軟件(edge AI software)、智能傳感器和設備(intelligent sensors & devices)。
從2012年到2022年,半導體領域的風投交易從40筆增加到515筆。2022年,該領域交易總額達到94億美元,高於2012年的2億美元。同樣,從2012年到2022年,該領域專利數量增長了7倍。
自20世紀70年代以來,芯片經歷了快速的創新,芯片性能每隔幾年就會翻一番。生產商必須跟上發展的步伐,否則就有被甩在後面的風險。隨着技術變得越來越復雜,新工具是必要的,這正是人工智能可以發揮作用的地方。
3. 2024年及以後的新機遇
生成式音頻可能是下一個大熱門
人工智能現在能夠根據不同語言、口音和方言的文本輸入創造人類的聲音和合成音頻。它使用了在ChatGPT中流行的生成式人工智能。
從2020年第一季度到2022年第四季度,提到“生成式音頻(generative audio)”的公司文件數量增加了13倍以上。
隨着音樂和聲音研發的深入,我們可能會看到新競爭者的爆炸式增長。很快,人們可以輸入文本或圖像來生成音頻內容,而不需要音頻專家或計算機專家。
這可能會影響遊戲、通信、音樂、新聞和醫療保健等一系列領域。擁有生成式音頻相關專利最多的公司包括索尼(Sony)、亞馬遜、華爲、字節跳動、Adobe、蘋果和騰訊。
可以生成什么音頻?
生成式音頻分爲四個主要類別,包括合成聲音(synthetic voice)、語音互動(speech interaction)、音樂生成(music generation)和音頻編輯(audio editing)。首先,通過深度學習,人工智能可以高質量地合成真實的人聲,包括音高、音調和節奏。語音互動包括虛擬助手等技術,例如蘋果的Siri和亞馬遜的Alexa。隨着技術的發展,人類與人工智能之間的“自然”互動可能會越來越多。
音樂生成技術可以輕松地創造出種類繁多的新音樂。例如Spotify的DJ和Aimi Studio。人工智能音樂已經對音樂產業構成了挑战。
最後,音頻編輯可以使用人工智能來提高音頻錄制質量。
2
結論
人工智能來了,新的創新就在眼前。以專利和風險投資等指標進行衡量,人工智能領域的創新在過去10年呈爆炸式增長。從風險投資活動和專利來看,過去十年中,超過三分之二的人工智能創新集中在交通、工業和消費者應用等領域,其次是自動化機器和服務型應用、半導體產業。
在2023年之後,我們預計生成音頻創新將會激增。隨着ChatGPT和DALL-E的到來,我們已經看到生成式人工智能引起了世界的關注。這些技術將共同改變遊戲和電影制作等行業。
文章系作者個人觀點如有疑問及任何意見反饋可直接在評論區留言或發送郵件
原文標題 : AI行業研報:生成式文字後即將爆發生成式音頻?
標題:AI行業研報:生成式文字後即將爆發生成式音頻?
地址:https://www.utechfun.com/post/223373.html