6月9日,是科大訊飛成立25周年。在司慶活動上,董事長劉慶峰以《頂天立地 星火燎原》爲題作主旨報告。他說,通用人工智能的大潮之下,國際國內大模型發展蓬勃、競爭激烈,科大訊飛從技術研發到商業落地都必須分秒必爭。
面向全體員工,劉慶峰分析了如何看待語音和大模型的战略機遇、如何看待科大訊飛當前競爭態勢、如何打贏大模型之战這三大問題,並坦言科大訊飛正經歷創業以來最充滿挑战、最扣人心弦、最激動人心的歷史時刻。
堅守十年,迎來語音和大模型的全新战略機遇
1999年,科大訊飛創始團隊定下公司使命“讓機器能聽會說,實現人類和人機信息溝通無障礙”。2014年,科大訊飛做出战略判斷,提出下一個發展階段從“智能語音”到“認知智能”,“讓機器能聽會說,能理解會思考”。堅守十年之後,科大訊飛在2024年迎來了前所未有的全新战略機遇。
如何看待語音產業和大模型的全新战略機遇?
劉慶峰以一直引領行業熱潮的OpenAI爲例,從通用底座的GPT-4,到有視覺功能的GPT-4V,到語音大模型Whisper、文生視頻大模型Sora,再到今年5月份發布的語音和音視頻能力都有所提升的GPT-4o,每一次更新都離不开底座大模型的智慧升級。同時,OpenAI把工程化也做得更加透徹,包括超擬人、全雙工對話、端到端的極致體驗速度,展示了人機交互能達到更好的水平,對整個語音市場都是一個非常大的推動。
劉慶峰表示,原來的語音合成、語音識別、機器翻譯等單點技術,通過大模型的理解能力、文本生成能力在後台加持提升,實現了語義理解、指令跟隨、多輪對話、情緒感知、超擬人合成,真正使得語音交互得到提升。
“在這個背景下,語音領域的幾乎所有應用都值得用新方式重構一遍,這就是現如今語音產業的全新战略機遇。”劉慶峰說,醫療導診機器人、酒店服務機器人、所有企業的客服機器人等都可以重新做一遍;7×24小時營業場所的部分崗位、企業中的服務類崗位等都可以用數字員工;汽車、手機、家庭助手等終端的智能語音服務也能得到很大提升。類似的應用領域非常多,產業空間巨大。
他分析,GPT-4o對萬物互聯時代語音浪潮的推動,類似於當年Siri對語音應用的推動。它備受關注的原因有幾個點:
超擬人合成,使得說話不再是朗讀腔調,而是真的像人一樣自由對話;全雙工交互,可以同時(瞬時)進行信號的雙向傳輸,人機對話可以隨時打斷和繼續;通過語音到語音的端到端建模實現快速反應的極致交互體驗。
目前科大訊飛在超擬人合成技術方面,中英文、多語種都做到了國際領先。全雙工技術方面,科大訊飛早在2016年就定義了萬物互聯時代的人機交互標准,包括遠場、多人、全雙工這些特性,2020年1月,在韓國釜山舉行的ISO/IEC JTC 1/SC 35全會上,科大訊飛主導提出了全雙工語音交互國際標准,2023年5月正式頒發。端到端的語音技術,背後有語音識別、文本生成、語音合成的過程,今年6月27日,訊飛星火V4.0發布也將給大家展示最新的端到端落地成果;端到端的語音技術建模,科大訊飛有全棧技術方案,也排在計劃中,需要算力和時間去實施,預計三季度推向市場。除此之外,科大訊飛還可提供GPT-4o沒有的一句話復刻、高噪音場景語音識別、多方言多語種免切換功能。
“大模型時代的語音技術本質上是一次推動萬物互聯和原有人機交互場景重構的巨大產業機會,科大訊飛一定能夠抓住最好的核心技術和應用的紅利。
”劉慶峰透露,下一步,科大訊飛將發力遠場高噪音多人說話場景、高表現力個性化場景、雲邊端一體化、軟硬件一體化,從技術優勢、市場先機、落地成效構建全方位持續領先優勢。大模型日益展現出的巨大潛力,讓行業賽道內玩家雲集,各種技術評測榜單層出不窮。劉慶峰一方面拿事實說話:訊飛星火在過程中不斷迭代,5月底上线的訊飛星火V3.5 Max版本已在文本生成、知識問答、邏輯推理、數學能力上超越GPT-4 Turbo 0429的最新版本;一方面也冷靜分析:大模型的能力可達程度也是分台階的,“就算是榜單第一,就算是超過了GPT-4 Turbo當前水平,面對今天的產業战略機會,還要看大模型在哪些領域能真正實用。”
劉慶峰認爲,大模型能力可達的程度是分台階的,可以分三個層次:
第一,一般難度任務,比如文本摘要、文本生成、要素抽取、基本意圖的識別等,使用通用基座模型或數千量級的SFT(一周左右就能做完),能達到比較好的程度;第二,中等難度任務,比如檢索類知識問答,需要有一個結合檢索和深度分析的場景,再如單場景的專用智能體,這就需要10萬級別的SFT並做比較深的優化才能有性能的顯著提升;第三,高難度任務,如高難度數學推理、長鏈條知識推理問答、开放領域的通用智能體等,短期內難以達到好用水平,需要更大規模參數的大模型並配合專用領域的算法模型才有可能完成,目前還在探索階段。
舉個例子,保險的知識問答是人機對話的典型應用領域。2023年11月,中國人民保險集團聯合認知智能全國重點實驗室和科大訊飛,研發了人保首個百億級參數的專屬問答領域大模型——“數智靈犀一人保大模型”。今年以來,通過數萬量級的SFT微調並採用全新技術方案,實現長文本能力的大幅提升,使得規模文檔的問答效果相對提升了70%以上。
在全新的战略機遇面前,劉慶峰亦坦言:今天大模型拼的不僅僅是底座能力,還必須圍繞剛需的使用場景構建真正的核心優勢。
三個關鍵維度看訊飛星火的領先地位
劉慶峰從大模型底座能力、承擔國家战略任務、行業龍頭客戶招標選擇三個方面給員工闡釋了訊飛星火的領先地位。
大模型底座的技術實力上,從認知智能全國重點實驗室牽頭、中科院人工智能產學研創新聯盟和長三角人工智能產業鏈聯盟共同參與設計的通用認知大模型評測體系看,今年5月底升級的訊飛星火V3.5 Max,已在多個能力上超過GPT-4 Turbo 0429的最新版本,在國內可測的大模型中處於領先地位,尤其是在文本生成(特別是英文)、邏輯推理、數學和代碼能力上領先優勢顯著。“當我們在通用能力上緊跟國際最先進水平以後,我們在教育、汽車、醫療等專用領域就可以實現超越。”(注:2024年高考期間,多家媒體和專業人士用高考中英文作文題和數學題對大模型能力進行測評,訊飛星火不僅佔據榜首,並超過GPT-4o。)劉慶峰預告,6月27日訊飛星火V4.0發布,將會進一步強化國內的領先地位。
從使命站位看,作爲國內第一個基於全國產算力平台訓練的大模型,完全自主可控的訊飛星火也承擔了國家發改委、工信部、科技部和中科院的多項國家战略任務,不斷夯實“國家隊”地位。“從長期來看,國家選大模型國家隊是綜合國力的較量,決定了國家的科研範式、產業形態和競爭格局。”
第三方的客戶選擇是大模型競爭力的重要體現之一,訊飛星火也成爲多領域頭部企業的首選。
在央國企市場,訊飛星火已成爲國家能源集團、中國石油、中國移動等行業龍頭客戶的選擇。其中國家能源集團的能源大模型招標後選擇科大訊飛;與中國移動聯合打造的5G AI商務速記和全新移動APP,在5月23日第七屆數字中國建設峰會上正式發布;中國石油也選擇了和科大訊飛共同建設“昆侖大模型”。
經過客戶的層層比選,訊飛星火已經成爲汽車、家電和機器人領域大模型應用的首選品牌。
在汽車領域,奇瑞、蔚來、廣汽、一汽等國產品牌都在和訊飛合作,國際汽車品牌大衆在評估後也迅速落地應用,於3月13日發布首款搭載星火大模型的車型“ID.UNYX” 。
在家電領域,海爾的家電大模型招標後選擇了科大訊飛。公司還在和美的集團、海信集團、TCL集團等家電企業开展全方面合作。
科大訊飛與優必選、傅利葉智能、宇樹科技、樸津智能等品牌开展合作,賦能近400家機器人企業。
劉慶峰說:“這些都是客戶慎重選擇、各家PK的結果,代表着訊飛星火真正的硬實力。”
訊飛星火的C端用戶粘性也越來越強,湧現出很多熱門助手。後台數據顯示:繪畫大師使用次數1674萬;寫作助手使用次數596萬;文案助手使用次數400萬……
今年5月初教育部公布了首批18個“人工智能+高等教育”典型應用場景案例。其中,北京郵電大學的“‘碼上’——大模型賦能的智能教學應用平台”、國家开放大學的“基於AI技術的大模型個性化英語教學創新實踐”,都是由訊飛星火大模型提供的技術,劉慶峰認爲:“除了大家都喜歡用的口語學習工具‘星火語伴’外,基於代碼能力延伸出個人助手和學習工具,也將一定會成爲每個人非常重要的助手。”
從技術中來到產品中去打贏大模型之战的5大核心战略
站在語音和大模型全新的战略機遇交匯處,擁有領先的身位,科大訊飛究竟要如何打贏這場大模型之战?
劉慶峰分析,大模型時代科大訊飛核心战略組成包括:
第一,賦能現有的軟硬件和行業產品,形成基本盤。背靠科大訊飛的根據地業務,深入教育、醫療、工業、汽車、家電等行業賽道,同時打造基於大模型的翻譯機、學習機等王牌硬件產品。
第二,开拓以央國企爲代表的重點行業客戶市場。按照大模型能力可達程度的三個台階,提供真正解決行業和企業剛需的方案。
第三,开闢新興賽道的軟硬件一體化授權和新硬件機遇。比如機器人硬件、醫療硬件等。
第四,在萬物互聯時代,AI助手的入口級战略機遇。以“能聽會說”爲前端,以“能理解會思考”爲後端,將極大推動萬物互聯時代進程。
第五,推進“訊飛超腦2030”計劃,邁向家庭陪伴機器人的萬億市場。
他也透露部分“大模型成績單”,其中大模型賦能的智能軟硬件產品成爲業績增長的關鍵來源:今年618實現“开門紅”,C端智能硬件的銷售額實現了同比82%的增長;今年1-5月份科大訊飛AI學習機銷量增長153%,用戶淨推薦值持續行業第一;星火大模型賦能的智慧黑板,已形成代差級領先;中國汽車出口的多語種技術幾乎全部由科大訊飛提供;以智醫助理的能力延伸出來的家庭醫生隨訪和慢病管理已經覆蓋了中國1.3億的居民;健康終端方面,訊飛助聽器的銷售額翻番增長,2023年在京東天貓618&雙十一獲行業第一。
訊飛的人工智能產業生態也在蓬勃發展,去年5月以來,訊飛开放平台的开發者團隊增加了200萬以上、總數增長了66%,大模型相關注冊开發者團隊51萬,其中企業开發者32萬、個人开發者19萬。其中不僅僅提供軟件,更有軟硬件一體化解決方案。
劉慶峰表示,大模型應用落地的一個關鍵是雲邊端一體化和軟硬件一體化,在底座能力和垂直方向上要做透還要做好,用更小的算力做出相對更優效果。“在雲側,我們有很好的大參數的通用模型(各種不同尺寸都有),也有星火一體機、‘飛星一號’算力平台等完全自主可控的硬件支撐;在邊、端側,科大訊飛有在汽車等行業落地的中等參數模型和軟硬件一體化方案,也有完全能夠在手機等智能終端上安裝和使用的‘小’模型和方案。從而形成了雲邊端一體化和軟硬件一體化的綜合落地優勢。”
船到中流浪更急,劉慶峰說,抓住大模型紅利的關鍵,最重要的還是“頂天立地”:核心技術保持業界領先,大模型底座做到領先,雲邊端軟硬一體化做到領先。“從技術中來,到產品中去,才能真正改變世界。”聚焦市場導向,做出典型領域的剛需產品,“把大模型賦能做到實處,把市場空間真正激發,這是我們要做的事。”
會上,劉慶峰也明確,科大訊飛價值觀的第一個就是一切爲客戶創造價值,公司下一步也將通過一系列機制推動面向战略市場領域的產品聚焦,讓產品最終能真正給客戶創造剛性的價值,可衡量、可評價。
“本輪的通用人工智能,從國內外的發展看都是‘大平台加英雄主義’,沒有通用大模型的底座能力,沒有算法、數據等各方面的積累,就沒有辦法做出改變世界的大模型應用和產品。所以必須站在大平台之上。”劉慶峰說,從底座能力和承擔的國家战略任務看,訊飛星火就是這個大平台,再往後大平台屬性還會進一步增強;除此之外,還要有英雄主義,讓每個人的創造力真正被激發出來,成爲充滿想象力、充滿战鬥力、充滿开拓精神的英雄。
他最後以托馬斯·潘恩《常識》中的話激勵所有人:我不會選擇做一個普通的人,我有權成爲一個非凡的人;我要夢想,我要建設,體驗失敗,體驗成功;我寧要有挑战的人生,而不要有保障的生存。
“帶我們走向遠方的不是船,而是心中的夢想。有這樣一個夢想衝動,我們每個人都可以走得更遠,科大訊飛往後的新10年、新25年、新百年就會走得更快更好,會成就一批偉大的產品,成就改變世界的偉大的事業,也會成就每個員工。讓我們攜手共進、頂天立地、推動星火燎原。”
本文作者可以追加內容哦 !
標題:科大訊飛25周年:創業以來最充滿挑战、最扣人心弦、最激動人心的歷史時刻
地址:https://www.utechfun.com/post/383027.html