中國AI長卷(三):算法生根

2024-08-06 18:40:41    編輯: robot
導讀 “中美AI差距究竟有幾年?”這個問題困擾了不少人,也有很多聲音嘗試將中美AI實力進行比較。其中,算法,一定是評判的首要標准。 中美AI算法究竟是什么水平?我們可以用“第七個燒餅”來理解。 ChatG...

“中美AI差距究竟有幾年?”這個問題困擾了不少人,也有很多聲音嘗試將中美AI實力進行比較。其中,算法,一定是評判的首要標准。

中美AI算法究竟是什么水平?我們可以用“第七個燒餅”來理解。

ChatGPT就是AI的“第七個燒餅”。深度學習算法的熱潮持續了十多年,終於在LLM(大語言模型)智能湧現之後,看到了實現通用人工智能的曙光。就像一個飢餓的人,連續喫了六個燒餅都沒喫飽,直到喫完了第七個燒餅,終於覺得飽了。

OpenAI爲代表的美國企業,在底層研發和核心算法上佔據領先地位,率先喫到了LLM的“第七個燒餅”。隨後,中國也極速跟進了這個領域,很快推出了對標ChatGPT、GPT-4水平的算法模型。

對此,有人欣慰:咱們雖然晚了一步,但也喫到了“第七塊燒餅”(中國沒有錯過大模型的機會)。

有人憤怒:這一次技術突破又是美國公司主導,它們肚子裏可比我們多好幾塊燒餅呢(美國領先我們至少十年)。

有人迷惑:早知道喫第七個燒餅就能飽,前面六個都不應該买(大模型之前的智能化探索全都白幹了)。

還有人質疑:中國根本沒有能力做燒餅,能喫上是因爲別的攤主公开了做燒餅配方(谷歌Transformer、OpenAI GPT-1/GPT-2都是开源的)。

以上不同的情緒,有各自的道理,源於對算法的認知不同。

《終極算法》一書的作者寫道:在農業中,人類進行播種,確保種子有足夠的水分和營養,然後收割成熟的作物,而這也是機器學習的承諾。算法是種子,數據是土壤,程序是成熟的作物。

算法,就是將大規模數據轉換成更合理、更智能決策的復雜程序,模型是它的軟件形態。算法模型,是AI產學界最重要的“收成”。

從這個角度看,簡單對比中美誰先拿下ChatGPT,其實並沒有太大意義。大衆真正關心的,是中國有沒有讓算法這顆“種子”播種、生根、成長、結果的能力,能不能確保中國接下來喫到新算法的第八塊、第九塊……乃至第N塊 “燒餅”,持續滿足各行各業享用AI的需求?

要搞清楚這個問題,我們得回到第三次AI浪潮的肇始,回到深度學習算法這顆“種子”剛剛萌芽的時候,看它是如何在中國落地生根的。

今天我們已經知道,深度學習是聯結學派的主算法,主導了第三次AI浪潮。

可問題是,深度學習並不是在2011年才橫空出世的概念。早在20世紀40-60年代,深度學習的雛形就出現在控制論中。訓練多層神經網絡的關鍵技術反向傳播算法,是1986年提出的。聯結學派,在2006年开始復興。

那爲什么,深度學習在2011年左右,才正式掀起了AI的新高潮呢?

背後有三個要素,構成了深度學習“種子萌芽”的土壤:

  1. 越來越多的數據量。深度學習算法的中心思想,就是將大量計算單元連接在一起來實現智能行爲,這個多層神經網絡就類似於大腦的神經元,依靠大數據進行學習和訓練,而互聯網、智能手機提供了較好的數據基礎,2011年谷歌大腦成功識別了一只貓,2012年蘋果推出了Siri,成爲深度學習算法的先行者。

2.越來越低的錯誤率,或者說越來越好的模型效果。2012年,多層神經網絡Alex Net在ImageNet 大型視覺識別挑战(ILSVRC)中獲得冠軍,並大幅超越了使用傳統機器學習算法的第二名,此後,深度學習每年都贏,證明了該算法的有效性。

3.越來越多的成功應用,深度學習這逐步成爲主導算法,被工業界用來解決很多實際問題,與上一代智能產品和應用相結合,讓一度停滯不前的語音識別、圖像識別、NLP等任務都得到了提高。

大數據、技術能力、智能產品,當時在中國,具備讓深度學習萌芽的條件嗎?有兩股力量可以。一是以BAT爲代表的互聯網公司,一是科大訊飛爲代表的早期AI公司。

BAT爲代表的中國互聯網公司,擁有海量數據以及國際化視野與人才團隊,同時有搜索、語音、電商等數字化業務與應用,擁抱深度學習這一新算法是必然。

2010年,百度成立自然語言處理部,由現任CTO王海峰帶領,开始在語言與知識技術上布局,提出了“自然語言立足中國、面向世界一流水平”的定位。2012年,百度積極關注並接觸深度學習領域的領軍人物Geoffrey Hinton,並於2013年建立了IDL深度學習研究院,2014年又成立了大數據實驗室BDL、硅谷人工智能實驗室SVAIL。除此之外,騰訊也在2012年成立了優圖實驗室,阿裏巴巴成立了iDST(數據科學與技術研究院)。

另一支探索路线,則是科大訊飛爲代表的早期AI公司。

這些公司大多是中國在智能領域的早期探索者,比如科大訊飛成立於1999年,創始人團隊主要來自中科大電子工程系人機語音通信實驗室。

在2011年之前,科大訊飛就以智能語音技術爲核心,進行了一系列技術、產品探索,比如科大訊飛聯合高校开發的復雜語音合成、語音識別引擎,就打破了海外廠商的壟斷,其語音軟件在教育、電信、金融、學習機等領域都有商用。隨着深度學習算法在國際上嶄露鋒芒,科大訊飛有意愿、有能力、有場景,將深度學習與原有的智能語音業務相融合。在2011年上线了中文語音識別DNN系統,2014年啓動了“訊飛超腦計劃”,探索讓“計算機能理解會思考”的感知智能和認知智能。

2023年,面對“中國何時能有類ChatGPT”“中美AI技術代差十年、三十年”的焦慮情緒, BAT、科大訊飛等企業作爲中國大模型的第一梯隊,很快帶來了文心、混元、通義、星火等基礎大模型。當然不是靠摘开源的“果子”,而是深度學習算法的“種子”,萌芽之初,就扎根在中國AI的土地上,並持續生長。

深度卷積神經網絡(CNN)在圖像識別和其他視覺任務中的突出表現,拉开了AI 1.0階段的帷幕。

具體來說,此前傳統的機器學習算法,雖然識別的精度和准確率也在提升,但始終無法同時保證准確率和識別效率,難以達到應用規模。而卷積神經網絡CNN由於參數共享和稀疏連接,非常適合處理圖像數據,在大規模圖像數據上訓練得到的深度卷積神經網絡模型,可以不斷從底層特徵中提取更高層的特徵(機器看得懂),最終更好地進行下遊任務的處理(機器看得到)。

CNN爲核心技術,在圖像識別、目標檢測、圖像分割、圖像生成等算法方面,帶來了極大的進步。2014年,香港中文大學團隊讓機器在人臉識別任務上的表現第一次超越了人類,被認爲AI 1.0階段的裏程碑事件。

疊加智慧城市、智能安防等概念的興趣,CV計算機視覺飛速發展,成爲深度學習最成功的應用領域。

這一階段,沐浴在新算法春風中茁壯成長的,自然就是CV企業。

2014-2017三年間,曠視科技、商湯科技、依圖科技、雲從科技相繼成立,依托於領先的計算機視覺技術,成爲行業領導者和資本市場的寵兒,估值迅速上升,成爲大家熟知的“CV四小龍”。它們的算法模型,被廣泛應用在城市、安防、醫療影像、工業質檢等領域。

當然,除CV之外,我們也不能忽略深度學習算法在NLP、語音、自動駕駛等多個領域中的進展,給許多行業帶來了發展動力。

比如長短期記憶網絡LSTM大幅提高了語音識別的准確性,智能助手在這一時期內得到了顯著的性能提升,海外的蘋果Siri、谷歌Google Assistant、亞馬遜Alexa、微軟Cortana等,國內的百度小度、阿裏天貓精靈等,被集成到多種智能終端軟硬件當中,並开啓了以語音交互爲核心的智能家居元年。

自然語言處理方面,循環神經網絡(RNN)和LSTM被應用於語言模型、情感分析、機器翻譯等NLP任務。比如,這一階段的機器翻譯,就從統計機器翻譯(SMT)進入到NWT神經機器翻譯時代,可以說是翻天覆地,中國的BAT(百度、阿裏、騰訊)、科大訊飛、搜狗等公司,都在各自的產品中部署了NWT,大幅提升了在线翻譯的連貫性、准確性和語感。

同時,深度學習還可以在感知和決策方面,爲自動駕駛汽車提供支持,吸引了很多投資基金的興趣,進入了快速發展的黃金時期。百度在2013年啓動了自動駕駛汽車項目,2017年推出了Apollo平台,並出現了小馬智行等一批面向L4自動駕駛技術的初創公司。

總的來看,AI 1.0階段,深度學習算法取代了傳統機器學習算法,成爲這一階段的主算法,爲很多領域的AI任務帶來了跨越式發展。

但這一階段的算法模型开發,仍是“手工作坊模式”,坊間戲稱“有多少人工就有多少智能”。依靠對大量數據的依賴,需要組建龐大的標注團隊,模型泛化性不足,專爲某個特定任務而設計,需要投入开發人員進行大量重復开發和手工迭代優化等。

從“手工業作坊”到“工業化AI工廠”,算法仍需一場嬗變。

凱文凱利說過,技術帶來的問題,只能靠技術進步來解決,算法也不例外。

從AI开發,從過去的手工作坊式向工業化升級,預訓練模型就是一條可以規模化生產高性能AI模型的“工業生產线”。

2017年,谷歌在論文《Attenlion is All You Needs》提出了Transformer架構。沒有使用上一階段流行的卷積神經網絡CNN、循環神經網絡RNN、長短期記憶網絡LSTM、GRU等結構,僅使用了自注意(Self-attention)特性,引入了注意力機制和預訓練模型(PTM)。在機器翻譯、機器閱讀、自動問答、情緒分析、自動摘要、語言建模等場景,顯現出了前所未有的能力。2018年,基於Transformer架構的預訓練語言模型BERT,刷新了11項 NLP任務的最優性能紀錄。同年,OpenAI推出了GPT-1。

基於Transformer架構的預訓練模型,可以通過模型的預先訓練,帶來效果更好、質量更高的算法模型,下遊只需要任務微調就能應用。這種“預制菜”一樣的“工業化模式”,一改小模型定制的積弊,讓大規模、可復制的AI應用成爲可能,成爲AI去往下一個時代的必經之路。

邁向預訓練模型的這條路上,中國幾乎與世界一流水平同步,得益於一個關鍵變化:雲智合流。

打造預訓練模型,最困難的一項,就是專用算力不足,有的學校甚至买不起GPU卡,沒有AI算力用。同時,這一階段很多政企用戶加速上雲,也希望智能化升級,以更便捷的方式獲取算法能力。

幸好,在這個算法更迭的關鍵窗口期,雲+AI的融合基礎設施,已經在建設中。

2017年,將AI技術作爲核心能力的華爲雲誕生。2018年,百度雲更名爲百度智能雲,阿裏雲升級爲阿裏雲智能。將AI引入公有雲的能力版圖,成爲主流。

雲智合流,讓AI开發從“手工業”邁入到“工業化”,將原本散落在算法全生命周期中的各類需求,進行了“融合”:

1.算力融合。預訓練模型不僅需要龐大規模的異構算力,而且需要高度的靈活性,從訓練到推理的每個步驟,所需要的算力是差異巨大的。通過雲廠商的基礎設施,企業可以彈性、靈活、按需取用地接入多樣、充沛的AI算力。獲取算力的方式變得簡單、高效、低門檻了,這就讓更多人參與到AI算法模型的开發中來,進入大規模生產階段。

2.流程融合。借助雲廠商提供完整、全棧的AI能力和开發工具,包括預制數據集、模型庫、算子庫等,讓企業和开發者可以在雲上完成從訓練-开發-推理-部署的全部環節。比如百度智能雲的EasyDLBML平台、華爲雲的AI开發生產线ModelArts等。

3.產品融合。時間來到2018年,智慧城市、智慧園區等都开始追求整體智能,希望構建一體化、解決方案式的“AI大腦”,整合算法、芯片、雲端算力、框架、網絡、IoT等軟硬件,實現智慧決策能力的質變。這種情況下,雲廠商和AI企業都要把自己變成一個“AI超市”,集成並供應豐富的AI技術能力與應用,讓行業用戶和开發者可以體系化、輕松地,獲取到所需要的AI能力。

比如百度智能雲率先在業界提出了“雲智一體,深入產業”的主張,發布了200多款產品和數十個解決方案,將百度AI技術釋放到金融、物流、工業、農業等多個行業。華爲雲在2021年啓動盤古大模型,並在2022年聚焦行業應用落地,基於盤古大模型的通用能力,打造了盤古氣象大模型、盤古礦山大模型、盤古電力大模型、盤古藥物分子大模型等。

可以說,雲智合流,爲中國AI跟上ChatGPT的大模型路线,奠定了基礎。

2023年以來,在海外算力形勢愈發嚴峻的背景下,國產預訓練大模型依然實現了“井噴”,在文本處理、圖像生成、音視頻生成、多模態等各個任務中,都完成了佔位。放眼全球,唯有中美這兩棵繁茂的AI“榕樹”。

讓深度學習算法的這顆“種子”,在中國扎根、生長、成熟,這本身就是一種能力的自證。

回顧深度學習的十多年歷程,或許某一種具體的算法會被更新更好的算法所取代,但這個雨打風吹、反復更替的過程,也讓中國AI在時光中變得愈發堅韌,積蓄了經驗、匯聚了人才、釋放了信心。

只要根深蒂固,任爾東西南北風,中國AI都能在每一次技術趨勢中,生長出新的枝丫,結出產業期待的果實。

       原文標題 : 中國AI長卷(三):算法生根



標題:中國AI長卷(三):算法生根

地址:https://www.utechfun.com/post/406936.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡