OpenAI o1开闢“慢思考”,國產AI早已集結在CoE“組團”先出發

2024-09-19 18:40:16    編輯: robot
導讀 OpenAI o1發布之後,復雜邏輯推理能力驚豔業界,數理能力達到博士水平。比如此前一直困擾LLMs的“9.9和9.11誰更大”問題,就在o1時代得到了解決。 於是有了一種說法:這一輪AI浪潮,中國...

圖片

OpenAI o1發布之後,復雜邏輯推理能力驚豔業界,數理能力達到博士水平。比如此前一直困擾LLMs的“9.9和9.11誰更大”問題,就在o1時代得到了解決。

於是有了一種說法:這一輪AI浪潮,中國越追趕越落後,跟OpenAI的差距越來越大。

圖片

現實情況真的如此嗎?我們不必急着下結論,不妨一起來思考三個問題:

近年來以大模型爲主的通往AGI之路,究竟是怎么發展的?

中國AI在世界一流技術路线上到底發展到哪一步了?

以及面對o1,國產AI能應對嗎、怎么應對?

圖片

毋庸置疑,OpenAI此前一直稱得上是AI技術創新的“火車頭”。從ChatGPT至今,OpenAI用一個又一個模型證明了,通往AGI的三個技術方向:

1.GPT路线。從ChatGPT到GPT 4o,這一路线的核心是用模型對token流進行統計建模的通用技術,token可以是文本、圖像、音頻、動作選擇、分子結構等。最新的4o就是多模態融合的代表。有業內專家表示,這一路线更貼切的名字可能是“Autoregressive(自回歸)Transformer”之類的,

2. Sora路线。Sora和GPTs一樣,都使用了Transformer架構,爲什么單獨作爲一支呢?因爲展現了一種對現實世界復雜現象的建模能力。圖靈獎得主、Meta公司首席科學家楊立昆(Yann LeCun)認爲,Sora可能是擺脫了人類專家所謂的一些知識幹預後,更接近世界本源的,更准確的一種建模方式。

3. o1路线。GPTs也好,Sora也好,都是概率模型,以損失推理效率爲代價,因此理論上永遠會出現偏差,具體表現爲“幻覺”、不可靠性。怎么讓模型具備真正的邏輯推理能力呢?o1路线通過Inference 的方法,基於強化學習(RL)能力,使用CoT思維鏈將復雜問題拆解,並讓多個子模型來協作解決,相當於復雜Prompt的自動化,極大地提高了模型的推理能力,確實在LLMs難以搞定的數理問題和復雜任務上有很好的表現。

圖片

不難看到,兩年以來OpenAI引領的三個方向,只要目標明確,中國AI都是可以攻下的。目前,國產類GPT和類Sora模型,無論是底層架構、具體技術、落地產品,其實並不遜色於OpenAI的模型,很快就縮小了技術代差。

這也說明了一件事,每一次OpenAI明確了方向,結果並不是“越追趕越落後”,反而可以讓中國AI聚焦並集中資源,進行有效研發,進一步縮小差距。

具體到o1,我們認爲也將延續上述走向,國產AI很快會完成突破。那么,目前業界准備得怎么樣了呢?

圖片

“在通往AGI的路上,已經沒有任何阻礙”,這句話來形容o1的意義,並不誇張。如此跨越式的突破,國產AI真的做好准備了嗎?我們深入技術本質,去追根溯源。

OpenAI聯合創始人、科學家Greg Brockman,在博客中剖析了o1的底層邏輯。他寫道:OpenAI o1是我們第一個通過強化學習訓練的模型,在回答問題之前會深入思考。模型進行系統 I 思考,而思維鏈則解鎖了系統 II 思考,可以產生極其令人印象深刻的結果。

所謂系統 II 思考,指的是人腦依賴邏輯和理性分析,進行的慢速復雜推理。可以與負責快速直覺決策的系統 I 相互配合,來實現更好的模型性能。

360集團創始人周鴻禕則表示,OpenAI o1遵循的可能是“雙系統理論 Dual Process Theory”,核心在於兩種系統並非獨立而是協同運作。由此推測,其內部構建的更加智能的模型或許是 GPT和o系列結合思維鏈的融合系統,前者用於“快思考”,後者實現“慢思考”。而CoE(Collaboration-of-Experts,專家協同)架構則集合了數量更多的大模型和專家模型,是通過思維鏈和“多系統協同”的方式實現“快思考”和“慢思考”。

熟悉國內AI的讀者可能發現了,“慢思考”這個說法怎么這么眼熟呢?

沒錯,如何提升機器的認知智能是AI界長盛不衰的話題,而“慢思考”這個創意也並非OpenAI獨創。早在今年7月底舉辦的ISC.AI2024大會上,周鴻禕就提過,360將“用基於智能體的框架打造慢思考系統,從而增強大模型的慢思考能力,把多個大模型組合起來解決業務問題”。

圖片

所以,大家可以放心的是,在技術創新高度依賴全球智力碰撞的今天,沒有一種技術思路是可以被壟斷的,甚至中國AI界提出“慢思考”更早。

當然,大家可能擔心的是,理念先進是一回事,是否具有相應的工程能力,打造出一個基於系統II思考的模型又是另一回事。具體到產品上,國產AI是否已經做好打造類o1模型的准備呢?我認爲,三個條件已經具備了:

1. 路线一致。模型的底層框架,是長期積累、厚積薄發的結果,國內360就和o1的技術架構保持着一致性。360首創的CoE架構8月1日正式發布,所謂CoE,就是Collaboration-of-Experts,專家協同,讓多個模型分工協作、並行工作,執行多步推理。CoE架構與o1的理念一致、方法類似,卻比o1發布的時間更早,足以證明國產AI在技術方向上並沒有落後,早已开始探索。

2. 產品落地。目前o1仍是preview預覽版本,用戶體驗的實際效果與官方用例有差距,而且使用也受到限制,o1-mini對ChatGPT Plus用戶的每周限制爲50個提示詞。技術再好,用不到也是“期貨”。這一點上,國產AI的產品化優勢就體現出來了,比如CoE架構已經在360AI搜索中落地應用,讓AI搜索在面對不確定或復雜輸入時表現出更好的穩定性,輸出更准確、更具有時效性和權威性的內容。基於CoE架構的360AI搜索,也超越Perplexity AI,快速成長爲全球最大的AI原生搜索引擎,並且還在以月增速113%的極高速度成長。

圖片

此外,360AI瀏覽器的AI助手,也可以非常直觀地讓用戶體會到模型競技場、多模型協作等功能。由於CoE架構已經接入了百度、騰訊、阿裏巴巴、智譜AI、Minimax、月之暗面等 16 家國內主流大模型廠商合作打造的 54 款大模型產品,用戶可以任意選擇3款大模型,進行多模型協作,以此達成比單個大模型回答問題好得多的效果。第一個做專家,對提問進行第一輪回答;第二個做反思者,對專家的回答進行糾錯和補充;第三個做總結者,對前兩輪回答進行優化總結。在很多的實測例子中,第一個專家模型即使回答錯誤,反思模型和總結模型都能夠在後續的協作過程中修正,與人類在做出重要決策的思維活動很像。

圖片

3.能力領先。可能還會有人問,國產大模型在數據、算法、算力上和Open AI都還有差距,這是實際情況,CoE“人多力量大”真的能趕上o1嗎?這一點,我們可以用實測來檢驗一下。

用業內著名的復雜邏輯推理題,比如假期調休題、9.9和9.11比大小等問題,同時詢問GPT-4o、o1-preview、360AI瀏覽器,會發現360的多模型協作,可以集各家所長,確實能起到“組團”打怪的效果。比如問“我爺爺的兄弟的兒子的老婆的妹妹的兒子,是我的什么”,360多模型和O1-preview都答對了,而4o 答錯。衆人拾柴火焰高,多模型協作力量大的優勢又一次得到了驗證。

總的來說,國產AI通過CoE架構進行協同,表現確實大多優於4o,與o1互有勝負。目前只是起點,CoE這個路线被驗證可行,未來隨着思維鏈、慢思考、協作模式帶來模型推理能力的大幅提升,國產混合模型的能力也可能逐漸媲美o1。

所以,他強由他強,清風拂山岡。OpenAI o1的確拆除了AGI路上的阻礙,但國產AI也並沒有臨淵羨魚,而是早已織好了網,集結在CoE這一路线。

圖片

難道國產AI永遠都只能跟在OpenAI身後亦步亦趨,做一個追隨者嗎?

當然不是。中美AI的場景不同、產業稟賦不同、技術落地土壤不同,也造就了各自的優勢所在。

誠然,OpenAI每一次都是新方向的开拓者、領頭人,但也可以發現,Sora、o1都帶有“期貨”色彩,至少仍然難以被規模化使用。其中既有產品成熟度的問題,也有成本高、企業落地難度大的挑战。比如有AI創業公司用o1解決實際業務問題時,發現Token數極大,成本極高,幾乎無法在現有業務中長期使用。有的創業公司爲了平衡成本,甚至會放棄使用最新版本的模型。

圖片

這一點來看,o1也給了國產AI在自身優勢上更進一步的機會,主要體現在:

1.基座模型的價值再次被肯定。此前頭部通用大模型廠商都多少進入到了“卷不動”的迷茫期,o1讓市場再次看到了基座模型的邏輯推理能力對於業務的價值是最關鍵的,是這一輪AI浪潮的核心,不容有失。這對於發力基座模型的廠商來說,是一個很好的消息,產業界和社會各界的信心進一步增強,有利於國產通用大模型繼續提高領先性。

2.技術產品化的優勢被放大。相比Sora視頻生成、4o語音交互,o1的產品化路徑更不清晰,如何回收成本將是OpenAI的一大挑战。這一點上,更重視大模型產品化、應用化的國產AI,或許會爲類o1模型更快找到落地途徑。

以CoE架構的產品化爲例,落地產品360AI搜索,已經實現了商業閉環,商業化收入已經覆蓋了對應的推理成本。這是因爲,此前CoE模型就很重視在加快推理速度的同時,降低API接口和Token的使用成本。

3. AI創新與智能經濟的加速。“比起AGI更重視ROI”,國產AI的務實特點,一度被認爲技術信仰不如OpenAI強大。但遠大的AGI目標,是靠一個個行業的AI化支撐起來的,這也是這一輪AI浪潮不會再次化爲泡沫的根本。那么,千行百業智能化就不得不談ROI,因爲企業引入AI都是有成本的,從這一點上,國產AI走得更扎實。今年國產大模型紛紛“提效降費”,中小AI企業和开發者的Token使用成本和創新成本都在下降。

在此基礎上,隨着CoE等類o1模型的升級,讓AI深入行業、解決具體業務問題有了更大的價值,RL+CoT進一步降低了Prompt提示工程的門檻,這爲中國智能經濟的增長,又打开了一個新的周期。

總結一下,通往AGI和智能時代的道路沒有捷徑,中國AI要一步一個腳印去丈量。兩年、三條路證明了360等中國AI的先鋒隊已經在新的技術路线上組隊出發。

凡走過的,必留下足跡;凡努力過的,必將收獲。從LLM到CoE,中國AI絕不會缺席這一輪技術浪潮。

圖片

       原文標題 : OpenAI o1开闢“慢思考”,國產AI早已集結在CoE“組團”先出發



標題:OpenAI o1开闢“慢思考”,國產AI早已集結在CoE“組團”先出發

地址:https://www.utechfun.com/post/423123.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡