(圖片來源:Pixels)
硅基規則下,虛擬和物理的終極分別是元宇宙和人形機器人,在其中,Sora便是橋梁。2024屬於Sora,毫不誇張。
@數科星球原創
作者丨苑晶
編輯丨大兔
OpenAI的Sora視頻大模型於近日上线,始一發布,引起熱議。
和其他大模型不同的是,該款模型屬於數據驅動的物理引擎,並且它可根據用戶提示詞生成高質量視頻。
它的發布,首先對以視頻爲載體的媒體、影視等行業形成了強烈衝擊。甚至可以說,它無限地降低了視頻創意、視頻制作甚至視頻藝術的門檻。
爲了剖析Sora的本質,數科星球(ID:digital-planet)正在大面積地對話行業大咖,以求釐清行業真知灼見、以饗創新。
全球化人工智能企業APUS創始人李濤認爲:“我們正處於AI大時代之中,想成爲紅利或財富的一部分,需要有足夠的敏感思考”,他指出,擁抱時代變化的要訣在於進化式學習,在這個過程中需要習得如何駕馭、使用、生產甚至左右新技術的發展方向。
此前,我們曾在《對話APUS創始人李濤:AIGC是一次發生在互聯網界的“工業革命”》中表達過部分觀點。在文生視頻浪潮來臨之際,他的認知迭代獲得了新的更新。
01
Sora推出背後的問題
在李濤看來,Sora的橫空出世反映了三個問題。
首先,在技術上,它已驗證打造無限逼近真實的場景是可能的。在一定程度上,Sora的模擬視頻會讓真實與虛擬難以區分。好的方面是,AI生成視頻拓寬了人類對創作、真實性和未來的認知。但壞的方面是,“真實”與“虛擬”的界限變得模糊,加大了定義和理解真實或虛擬的難度。
其次,Sora展現了強大的學習能力。“我認爲,這種學習能力不僅局限於數據的吸收和處理,更在於邏輯和規則上的深度理解和應用。”
作爲一款可自我學習的模擬器,如今的Sora正在嘗試學習人類所擁有的規則和邏輯能力。更爲形象的比喻是:就像有光就會有影子、有火就會被點燃一樣,Sora的類人智能擁有高速學習能力、反應能力和反應速度。
其三,Sora的出現,客觀上反映了我們在芯片、算力等領域的落後。“縱覽Sora的能力構建會發現,這與OpenAI在人工智能領域的深耕分不开”,他提到。
英偉達、Sora猶如一面鏡子,其成功的背後反映了中美在AI領域的差距。李濤認爲,這折射出中國人工智能所擁有的能力遠遠落後於前者。他對數科星球(ID:digital-planet)強調,彌補差距的根本是加強芯片的研發、努力提升算力水平。而這,已成爲我國AI發展的當務之急。
02
Sora推出後的預測
Sora的推出成爲了每家投資機構的話題,而在大模型產業界,情況同樣如此。如果說,2023年的“百模大战”屬於Transformer內卷,那么2024的开年伊始,行業格局已完全不同。
李濤認爲,Sora跟GPT不是同一個模型。“它和GPT完全不一樣,這是Sora最大的不同”,這可被理解成是在新位面上的新競爭,“在我看來它是顛覆性的、炸裂的、有战略性的。”
技術上,以往的人工智能模型均是人們對真實物理世界抽析後的文明或知識、常識的處理。在人們將現實世界的內容數據化之後,便已經“失真”,而再將“失真”生成圖片或視頻,會導致進一步的“失真”。
Sora的最終期望是構建可渲染真實物理世界的模型(這區別於以往所有模型)。這會導致一個結果,人們將無法區分真實世界和虛擬世界。在能處理好真實世界和虛擬世界的轉場前提下,Sora的出現將極大推進元宇宙的實現速度,“甚至會模糊掉AR或VR的行業邊界”,李濤說。
還有一點,Sora的學習性應該被重視。
李濤做了一個比喻:“就像有光就有影,被刀劃了一下就會痛,就會流血,這都是真實物理世界裏面的邏輯關系。”在他看來,Sora正在學習真實物理世界的規律,這種學習模式正在逼近人類智慧或人類大腦的學習模式。
“我們可以看到,這樣做的好處是,可以通過Sora在任何兩個場景、任何兩個景物、任何兩個要素之間建立起它的邏輯關系。”根本而言,它將推動邏輯關系的進步,作爲一個學習引擎,可以被看作是超越人類的“智腦”。
綜上所述,相比於人類而言,Sora的學習速度、存儲能力、構建和渲染的能力遠遠超過了單個人本身。這種以強大算力做支撐的能力,可以將學習過程壓縮爲非常短的時間。
另外,李濤還預測,OpenAI一定會將GPT和Sora結合,以重構數字物理世界。“Sora最有衝擊力的地方在於,它會不斷地抽析、學習人類常識,通過7*24小時不眠不休的方式結合算力放大和復制數字世界。”在算力足夠大的時候,它的學習能力將大大超出世界上80億人的學習速度總和。
03
新的競爭格局與技術分析
人工智能的未來競爭格局是什么?答案是算力。
縱覽AI發展歷史,可以看到一條清晰的路徑:即代碼-參數-算力競爭。在這套邏輯的背後是芯片至上。
在IT信息化領域,企業的競爭優勢從編程優勢過渡到了參數優勢、算力優勢。“現在,參數競爭又有了新變化,你會發現Sora的參數並不大,算是小模型,但它的影響很大,並且依賴高制程芯片和強大的GPU算力”。李濤如是說。
李濤還估計,OpenAI未來只會爲自己服務,將研發專屬於自己的芯片,且不會通用。
另外,在未來,AI可自行研制芯片,所有的設計、制造均通過AI完成:由AI完成所有定制化服務,繞开通用芯片的桎梏形成閉環。對國內企業的警示是,短期內,AI產業難以追得上英偉達或OpenAI,雖然二者之間已貌合神離、相去漸遠。
不過,好消息是,國內的企業正在鑽研Sora的技術內核。
李濤對數科星球(ID:digital-planet)分享了自己的看法,他認爲,Sora是以MoE的結構控制的分布式學習模型。“換句話說,假如它有100萬台GPU的機器,那么它很有可能把這100萬台分成了1萬個單元組,每個單元組有100台GPU完成不同獨立的項目。”
在決策單元上,李濤認爲,Sora的中央控制單元架構同樣發生了變化。“它可能不是用以往小控制單元控制(比如一萬個GPU中一個輔助控制單元,另外9999個負責工作),而是採用了5000個單元形成決策單元,而另5000個單元進行‘手和腳’的工作。”
根本上,Sora的每一個單元負責了某個不同的垂直領域、去學習不同的物理世界的知識,因爲學習不同的物理世界,需要總結不同的邏輯。
最後,Sora除在探索未知物理世界方面裨益很大外,還改變了算力單元的使用規則:“未知的物理世界的探索可以不斷延伸,只需要增加算力單元加以探索就可以了,這個算力單元不是1億台GPU,可能以100台GPU爲一個算力單元或1000台GPU爲一個算力單元就可以實現”,李濤補充道。
技術上,通過單獨的算力單元做學習和計算是一大創新。這種模式對算力依賴極大、是以MoE結構控制的分布式學習模式。“它都不能叫分布式計算了,如果與我們推測的一致,你就會知道它有多強大,幾乎很難追趕。”
04
Sora變革下的應對之策
面對Sora帶來的顛覆性變革,普通人的應對之策是什么?
在與李濤的對話中,我們總結了三點:
首先,短期要學會和駕馭Sora:普通人需要積極學習並掌握Sora的相關技術,理解和應用這一模型。
這樣一來,能夠讓我們在AI時代下保持競爭力。通過深入研究Sora的工作原理和應用場景,相關從業者可以更好地發揮其在內容生成、影視制作等多領域的優勢。
第二,在中期,需要快速學習Sora內核:面對Sora的快速發展,人工智能的從業者需要不斷提升自身的學習能力,要跟得上Sora的步伐,確保在AI領域不被甩开身位。
第三,長期上,需要行業間加強芯片的設計、研發、生產工作:人工智能的發展是從代碼、參數到算力競爭的過程,而芯片是人工智能進化的基礎。因此,提升算力,才能推動AI技術實現創新的發展。
就中國而言,如何應對算力方面的挑战,國家需要加速芯片的研發進程,通過提升芯片的性能和效率,爲AI提供更強大的底層支持。
李濤認爲:“當Sora开始作爲一個智腦,能從現實社會像人類一樣從現實的物理社會去學習,可以去重新構建和渲染一個新的物理社會,並且具有一致性和連貫性跟真實世界無法區分出來的時候,會有多可怕,這就是人腦的過程。”
現在,Sora已經像人腦一樣在工作,它可以把現實物理世界學習過來,然後又把它重新渲染和構建出來。
05
結尾:思考、學習與進化
在這個時代,普通人應該如何應對未來的挑战?
李濤直言:“要想跟得上這個時代,當新東西出現的時候,一定要沉靜下來,讓自己更深刻地思考,我們在一個大時代裏面,要想辦法捕捉住這個大時代的財富,或者捕捉住大時代的紅利,並且成爲財富和紅利的一部分。”
他認爲,當像Sora這樣的新東西出現的時候,一定要有足夠的敏感去思考,然後深度學習,最後進化。而所謂進化其實是去學習怎么去駕馭、使用、生產它,甚至左右它的方向。
原文標題 : 對話APUS創始人李濤:Sora浪潮下,如何成爲紅利和財富的一部分
標題:對話APUS創始人李濤:Sora浪潮下,如何成爲紅利和財富的一部分
地址:https://www.utechfun.com/post/334420.html