2023WAIC大會後記：我們距離AGI還有多遠？

2023-07-15 18:40:04 編輯： robot

導讀只有解決了算力問題，才能離大模型的商業化之路更進一步，等等問題，都在成爲當下限制我們想象力的關鍵因素。繼2023世界人工智能大會後，大模型還有多少想象力？作者|思杭編輯|皮爺出品|產業家 ...

只有解決了算力問題，才能離大模型的商業化之路更進一步，等等問題，都在成爲當下限制我們想象力的關鍵因素。繼2023世界人工智能大會後，大模型還有多少想象力？

作者|思杭

編輯|皮爺

出品|產業家

1億用戶，似乎是每個App都想踏過的“門檻”。TikTok用時九個月，ChatGPT用時兩個月，而被稱之爲“Twitter Killer”（推特殺手）的Threads僅用不到五天的時間，就達到用戶量破1億的水平。

Threads的定位是基於Instagram上的對話App。也就是說，Instagram的用戶可以用账號注冊Threads，並且他們在Ins關注的人也都會轉移到Threads上。這也是爲什么，擁有了聊天功能的Threads，也號稱復刻版推特，或推特殺手。自此，人工智能領域將展开馬斯克與扎克伯格的新一輪“角鬥”。

這些都在成爲7月6～8日的本屆世界人工智能大會的最新背景板。

2023上半年，人工智能的發展似乎到達了一個臨界點，世界人工智能大會上呈現出的所有AI產物也僅是冰山一角。

根據不完全統計，目前國內發布的大模型數量已過百，但更多集中在C端，針對B端的行業大模型仍在少數。大語言模型的產業商業化之路還很遙遠。

不免思考的一個問題是：我們距離AGI的路到底還有多遠？

在本屆WAIC大會上亮相了30多款大模型產品，在這其中，不僅有百度、阿裏、騰訊爲首的互聯網廠商陣營，還有以雲知聲、瀾舟科技、商湯科技爲首的AI企業陣營，更有以中國電信、中國聯通爲首的運營商陣營，以及以清華大學、復旦大學爲首的學術陣營。

透過它們的動作，我們試圖丈量我們和AI終點的距離。

【以下爲產業家於WAIC現場紀實】

清華

大模型在算力、准確性、時效性和隱私保護方面還存在瓶頸。

在算力方面，如何降低耗能、提高效率是大模型面臨的關鍵問題，它直接決定着大模型未來是否能達到商用水平。如果用在垂直行業，會需要更精准的模型，這要求大模型要有低延時、高安全，並且提供精准信息的能力。然而，目前大模型不僅十分消耗算力，用於專業領域還存在幻覺問題。

針對該問題，清華大學智能產業研究院張亞勤院長在2023世界人工智能大會（WAIC）上發表演講，“AI發展需要人才、數據、算法、算力四個方面的支撐，其中算力會是最大的挑战。目前GPU市場由英偉達主導，很多其他公司雖然也在做，但仍然不能滿足大模型發展的需求。在這一點上，需求是創新的源泉，如果未來算力成爲了關鍵“卡脖子”因素，那我們就需要尋找新的模型和算法，或者新的計算平台，以降低計算成本並提高效率。”

百度

百度CTO及應用國家工程研究中心主任王海峰在會上對文心大模型3.5版核心技術進行了全面解讀，並結合百度發布的飛槳生態，闡述了人工智能產業模式。

在王海峰的介紹中，文心大模型3.5有三大技術創新。

一是對先進生產力的期待，文心大模型3.5在模型效果、安全性和邏輯推理均有提升；二是對行業專家的期待，通過“精調”+“知識點增強”兩大技術創新，新版本讓大模型具備行業專家一樣的專精能力；三是對豐富應用的期待，比如通過插件機制擴展大模型的能力邊界。未來，文心一言將發布更多優質的百度官方和第三方插件，幫助开發者基於文心大模型打造自己的應用。

王海峰在致辭中提出，大模型的產業模式將是“類台積電”模式。“以台積電、三星等企業爲例，芯片制造工藝有很高的技術壁壘、價格高昂的產线，能夠根據客戶需求，標准化、自動化地大批量生產芯片，形成規模經濟。同理，大模型生產企業在大模型能力、海量數據、大規模算力等方面具有優勢，能夠根據AI應用方的需求，自動化、標准化地進行多場景多領域的模型生產，當達到一定規模時，即可形成健康、可持續發展的大模型產業模式。”

大模型的“類台積電”產業模式，已經在百度的大模型實踐中得到驗證。百度研制了文心產業級知識增強大模型系列，其背後又有飛槳的有力支撐。飛槳將集核心框架、產業級模型庫、开發套件和工具組件，以及學習和實訓社區於一體，標准化、自動化地支撐大模型生產和應用。

阿裏

其次，阿裏雲作爲業內最早布局大模型的科技公司之一，在本次的WAIC大會上邁出了多模態能力的關鍵一步。繼通義千問之後，阿裏雲宣布AI繪畫創作大模型通義萬相开啓定向邀測，該模型可輔助人類進行圖片創作，未來可應用於藝術設計、電商、遊戲和文創等應用場景。目前，該能力將逐步向行業客戶开放。

阿裏雲智能集團CTO周靖人對於多模態的理解是，“多模態是大模型演進的必然路徑，我們希望用不同模態的能力服務千行百業，幫助企業全面擁抱智能化時代。”

此外，阿裏雲在本次WAIC大會上的另一個靶點是，通過「魔搭社區」，爲大模型創業公司提供全方位的服務，從而搭建一個“大模型自由市場”。

周靖人表示，“在魔搭這個自由市場，所有模型生產者都可上傳模型，驗證模型的技術能力，探索模型的應用場景和商業化模式。而阿裏雲將提供智能算力和开發工具，並在資金和商業化探索方面提供充分支持。”

在本屆世界人工智能大會上，一個值得關注的重點是行業大模型的發布。此前，大模型都是主要集中在C端的通用大模型，因此在本屆WAIC大會上幾家行業大模型的亮相備受矚目。

騰訊

會上，騰訊集團高級執行副總裁、雲與智慧產業事業群CEO湯道生對於行業大模型發表了看法，“通用大模型有很強的能力，但並不能解決很多企業的具體問題。企業的大模型應用需要綜合考慮行業專業性、數據安全、持續迭代和綜合成本等因素。基於行業大模型，構建自己的專屬模型，也許是企業更優的選項。”

在數據精准性和隱私安全問題上，企業可以基於行業大模型，再加上自身數據進行精調，從而構建專屬模型。這樣打造出的模型參數比通用大模型少，訓練和推理的成本更低，模型優化也更容易；另外，行業大模型和模型开發工具，也可以通過私有化部署、權限管控和數據加密等方式，防止模型訓練和使用帶來企業敏感數據的外泄。

另外，騰訊雲智能和騰訊優圖實驗室在現場重點展示了小樣本數智人、刷掌支付、騰訊同傳等互動體驗項目。比如小樣本數智人依托於騰訊自研AI能力，只需要3分鐘真人口播視頻、100句語音素材，平台便可通過音頻、文本多模態數據輸入，實時建模並生成高清人像，在24小時內制作出與真人近似的“數智人”。

在作曲方面，騰訊實驗室拿出了自研的XMusic通用作曲框架，被稱之爲本屆世界人工智能大會的“鎮館之寶”。該XMusic生成式通用作曲框架使基於AIGC技術，支持視頻、圖片、文字、標籤、哼唱等多模態內容，作爲輸入提示詞，生成情緒、曲風、節奏可控的高質量音樂。

華爲

關於行業大模型產品，在本屆大會的另一個重磅發布則是華爲的盤古大模型3.0。

華爲以“不作詩，只做事”爲口號，推出了以B端市場作爲目標的大模型產品。

此前，在國內互聯網企業熱衷於“百模大战”之時，華爲並沒有戀战，而是相繼發布科學計算大模型、藥物分子大模型、盤古礦山大模型和氣象大模型。其中，盤古氣象大模型的研究成果還在《Nature》正刊上正式發表。

在《Nature》期刊上，華爲雲盤古大模型團隊基於三維神經網絡的氣象預報系統精度，研發出高分辨率全球AI氣象預報系統，這種方法超過傳統數值預報方法，且速度提高了1萬倍以上。而就在2022年末，國際氣象領域的專家教授們還普遍認爲，AI要達到傳統數值方法的精度，是一件非常遙遠的事。

華爲常務董事、華爲雲CEO張平安在發布大模型時透露，目前，“盤古大模型已在金融、制造、醫藥研發、煤礦、鐵路等諸多行業發揮巨大價值。”

中國電信

此外，中國電信也針對政務、司法、教育、醫療和通信等垂直行業推出領域大模型TeleChat。在發布會現場，中國電信展示了大模型賦能數據中台、智能客服和智慧政務三個方向的產品。

中國電信數字智能科技分公司何忠江副總經理針對大模型與行業融合，並解決幻覺問題做了闡釋。

首先，大模型爲什么會出現幻覺？實際上，大模型生成的詞句是依據概率逐字推理的方式得出，而這種概率矩陣的方式必定會出現幻覺問題。對此，中國電信在設計大模型的過程中，用一定技術改善了概率矩陣出現的幻覺問題。另外，將行業知識與大模型融合，從而增強大模型的預訓練和推理能力。

可以說，在消除幻覺問題方面，電信TeleChat大模型做出了先人一步的創新。

京東

在AGI時代浪潮席卷而來的當下，多家廠商都表示，大模型的下一步是走向多模態。7月13日，京東重磅發布了言犀大模型。自此，百模大战又添一員。從發布會現場來看，京東的言犀大模型更注重產業側，“從產業中來，到產業中去”也是京東對外宣傳的一句標語。

京東憑借多年來在供應鏈側沉澱的數據信息，將言犀大模型的定位置於供應鏈端。“只有將供應鏈做透，才能將大模型做實。”京東集團技術委員會主席、京東雲事業部總裁曹鵬表示，數智供應鏈，是大模型走向產業應用的着力點，大模型要以數智供應鏈爲抓手，走向產業，深入實體。

京東爲了給大模型注入產業能力，輸入了大量的專業數據，其中包含70%的通用數據和30%的數智供應鏈原生數據。這些數據的背後，是京東爲大模型提供的巨型訓練場。發布會現場，京東CEO許冉表示，“大模型真正實現自己的價值，一定是在產業應用中。”

網易

在本屆WAIC大會上，網易也攜多款AI大模型落地產品進行展出。在工業、教育、遊戲、音樂和元宇宙領域，網易都推出了不同行業的大模型，應用到各大場景。

比如在工業領域，網易伏羲基於AOP理論思想及自研工業大模型，推出國內首台無人裝載機器人和挖掘機器人，參與到礦山、鐵路等一线場景的建設；在教育領域，網易自研的國內首個教育大模型“子曰”最新應用成果——虛擬人口語教練首次亮相。

在此前網易發布一季度財報的電話會上，網易CEO丁磊對於大模型也發表了自己的看法，“在AI大模型競賽中，真正的勝者是能選擇好應用場景的企業。”

從網易一季度財報來看，在AI大模型等自研關鍵技術投入上，研發投入37億元，佔總營收比重達15%。而且目前，網易自研AI技術已應用於遊戲工業化全流程，AI技術對關鍵環節的工作效率提升達90%。

科大訊飛

在國內大模型的隊伍中，科大訊飛的星火大模型從效率和精度的角度看都數一數二。在世界人工智能大會上，科大訊飛展示了星火大模型在教育、辦公、汽車、醫療、工業等領域的應用。

另外，科大訊飛高級副總裁、認知智能全國重點實驗室主任胡國平還公布了訊飛與華爲的合作。訊飛星火與昇騰AI聯合，全力打造通用智能新底座。“國產大模型只有基於中國自主創新的算力底座才有大未來”，胡國平表示。

在大模型加速迭代趕超的背後，是不容忽視的算力挑战。而訊飛與華爲的合作意圖，正是讓國產大模型可以架構在自主創新的軟硬件基礎上，打破算力瓶頸。

中國移動

在央企大模型的隊伍中，除了中國電信的TeleChat大模型，中國移動針對政務和客服，也正式發布大模型：九天·海算政務大模型和九天·客服大模型。

中國移動的九天大模型首創了“政務大模型-信息場-應用”端到端政務服務體系，一網通辦的服務理念將被更加安全、高效地體現在群衆的辦事體驗中。比如對於政府工作人員，通過大模型和信息場的聯動，直接用自然語言與數據庫中的海量政務數據表和運營分析指令交互，串聯多來源、復雜異構的數據表，快速獲取數據分析結果。

商湯

在AI企業的大模型陣營中，商湯科技也在會上推出 “商湯日日新SenseNova”大模型體系的多方位全面升級，以及在該體系下的一系列大模型產品更新和落地成果。

此外，商湯也着重介紹並展示了其大模型技術自正式發布以來與產業各方的應用實踐，包括商湯絕影最新打造的智能座艙產品和車路雲協同交通體系等，以及在金融、醫療、電商、移動終端、產業園區等行業生產實踐中的落地應用。

作爲千億級參數的自然語言處理模型，商湯商量SenseChat 2.0版本突破了大語言模型輸入長度的限制，並推出不同參數量級的模型版本。

商湯科技董事長兼CEO徐立在產品發布環節中講到：“商湯希望通過‘大模型+大裝置’持續推動AI基礎設施能力的躍進提升，不僅打造通用能力更加強大的基礎模型，也進一步高效融合不同垂直領域的專業知識，構建專業大模型，從根本上降低大模型的下遊應用成本和門檻。”

容聯雲

在大會上，智能通訊SaaS企業容聯雲也發布了大語言模型“赤兔大模型”，面向企業應用的多個垂直行業。另外，爲推動企業營銷和服務數智化轉型，容聯雲還發布“生成式智能營銷服一體化工作空間——機器貓”和“生成式一體化智能客服平台”。

據了解，赤兔大模型是容聯雲面向企業應用的垂直行業多層次大語言模型，通過重構智能客服和數智化營銷價值，賦能溝通智能2.0時代。基於“赤兔大模型”，企業可以搭建自己的智能客服和數智化營銷，完成從“降本增效”到“價值創造”的進化。

在7月12日的“東風生萬物”發布會上，思必馳也帶來了DFM-2大模型以及最新創新技術應用成果。據了解，思必馳本次推出的DFM-2大模型，一大特點在於將對話式人工智能與大模型相結合。思必馳聯合創始人、首席科學家俞凱曾公开表示，“對話式語言計算大模型爲核心的大模型體系是未來。”

“短期來看，關於需要基於一定背景知識的創作型產業，以及一切剛需AIGC的場景、重視SOP（標准作業程序）的行業，能夠快速突破。比如智能寫作、文檔管理、代碼生成、流程管理、甚至遊戲NPC等。長遠來看，搜索引擎和基於搜索的相關產業，有可能被顛覆。”——財聯社安安訪談錄《思必馳聯合創始人俞凱：ChatGPT是繼Alpha Go之後最大的裏程碑》

美團

在2023WAIC大會上，除了各大企業的大模型產品，還有其他領域的AI技術展示，如美團“無人機”、騰訊雲智能的刷掌支付和騰訊同傳。

在大會上，美團展示外賣如何“從天而降”：美團無人機對外發布第四代新機型，該機型研發歷時兩年多，是專注於城市低空物流配送場景的全新多旋翼機型。

新機型升級了環境適應能力，可在“零下20度至50度”的中雨、中雪、6級風、夜晚等環境中穩定飛行，能夠適應97%以上國內城市的自然環境要求。

美團高級副總裁、到家事業群總裁王莆中表示，近兩年，越來越多的用戶傾向於“线上买一切”，且對配送時效的要求愈發嚴格，通過搭建空地一體的立體化城市配送網絡，美團可以爲消費者提供更好的服務體驗。

本屆的世界人工智能大會尤其熱鬧，從大模型到現場“逗狗”，從無人機發布到馬斯克腦機接口，都在說明，人工智能的發展正在邁向一個新的階段。

然而在這個新階段，無論國內外，都正在受到不同層面的約束。比如國內外大模型的“團战”受算力影響尤爲嚴重。具體來講，研發和使用大模型都需要耗費GPU卡。而目前，GPU卡的費用不斷上升。找到能夠降低算力損耗的算法是當務之急，只有解決了算力問題，才能離大模型的商業化之路更進一步，等等問題，都在成爲當下限制我們想象力的關鍵因素。