6月27日,科大訊飛發布訊飛星火大模型V4.0及相關落地應用。該公司董事長劉慶峰表示,訊飛星火V4.0已經實現了與GPT-4 Turbo的對標,在文本生成、語言理解、知識問答、邏輯推理、數學等能力上都已經實現超越,但在代碼和多模態能力上還有差距。
在劉慶峰看來,在推動源頭智能體开發到行業生態的過程中,特別重要的是,一定要做到底座技術的完全自主可控,“否則可能我們就把大樓建在別人的院子裏,建在沙灘上,隨時會倒塌,要真正做到軟硬件一體化,才能更深度地落地。”
圖源:觀察者網“去年10月17日,英偉達因爲美國商務部的要求,對中國所有能訓練大模型的智能算力全面斷供。就在6月25日,OpenAI也正式通知將從7月9日开始終止所有來自中國的API申請。在這個背景下,熱熱鬧鬧、風起雲湧的通用人工智能浪潮,到底有沒有自主可控的國產底座能力做支撐,這決定了我們在這條路上到底能走多遠。”劉慶峰說道。
他在會上透露,去年10月24日,科大訊飛聯合華爲在安徽發布了中國首個國產萬卡算力集群,這是中國第一個能訓千億以上浮點參數大模型的硬件平台。在這個硬件平台上,訊飛星火是中國第一個基於國產算力訓練出來的全民开放的大模型。
萬卡集群,是指由一萬張及以上的計算加速卡(如GPU、TPU或其他專用AI加速芯片)組成的集群式的高性能計算系統,主要用來訓練數據量日益龐大的通用大模型。這種集群充分整合高性能GPU計算、高性能存儲以及網絡、智算平台等關鍵技術,可支持千億級甚至萬億級參數規模的大模型訓練,有助於大幅壓縮訓練時間,以實現模型能力的快速迭代升級。
那么在這個基礎上,訊飛星火V4.0到底到了什么水平?劉慶峰表示,訊飛星火V4.0在中文領域實現了對標GPT-4 Turbo,在絕大部分是英文的12項主流測試集中,訊飛星火V4.0有8項實現了超越,“這個數據大家可以直接調用我們的API自己去測。”
圖源:觀察者網但他也提到,星火大模型V4.0與GPT-4 Turbo在代碼和多模態能力上還有差距。
“今年1月,GPT-4 Turbo程序員測試大概在80分,現在86分,也在快速迭代和進步。我們預計在今年8月份,訊飛星火會達到現在86分以上的水平。多模態能力還有所差距,是因爲我們當前在文生視頻上還沒有算力,也不是下一步的核心重點,但是有生態夥伴一起做。”劉慶峰說道。
去年9月,OpenAI發布GPT-4V,在圖文識別和理解分析能力方面上了一個大台階,11月推出語音識別大模型Whisper,今年2月又推出了文生視頻大模型Sora,5月推出GPT-4o……
在劉慶峰看來。這些實際上還是依托GPT-4的底層通用大模型能力,“以Sora爲例,並不是外界所說的其‘對物理世界的認知進一步加強了’,而是通過GPT-4V的理解能力和生成能力,結合GPT-4V的‘打標籤’能力、傳統的文生視頻能力,用GPT方法做了重寫,從而實現了Sora的能力。與大模型在醫療領域做一個醫療專用模型、在教育領域做一個教育專用模型並沒有本質差別,只要有算力、有數據,這些都能實現。”
這次基於星火大模型能力,訊飛星火APP/Desk全新升級,發布“個人空間”;面向專業領域的個性化應用,該公司升級訊飛曉醫APP,上线個人數字健康空間;業界首發星火智能批閱機,“AI助教”助力老師減負增效、因材施教;訊飛AI學習機升級 1對1答疑輔導功能。
圖源:觀察者網面向萬物互聯時代,科大訊飛星火語音大模型發布74個語種/方言免切換對話,破解強幹擾場景下語音識別難題,發布國際領先的極復雜場景語音轉寫技術等,此外該公司還正式發布星火企業智能體平台,並推出星火商機助手、星火評標助手等典型智能體案例。
但值得注意的是,星火大模型V4.0對標的GPT-4 Turbo發布於去年11月,距今已近9個月。
劉慶峰也坦言,我們一定要科學理性地認識到中美科技的綜合差距。“今天我們說訊飛星火V4.0對標GPT-4 turbo是全方位對標。但是我們同時要看到,一旦GPT-5發布,因爲它的模型尺寸更大、訓練時間更長、數據更多,又會把這個差距給拉开,甚至拉到一年以上。”
“在中國,一定要考慮用更小的算力、更小的數據,做出更優質的落地成果,這樣才能夠真正地在未來幾年打贏這一場人工智能紅利賦能產業的‘仗’,但同時,整個社會還要加強源頭技術創新的氛圍,一定要看到中美之間的差距,才能夠迎頭趕上,絕不能盲目自信,盲目地認爲我們都已經超越了。差距還是很大的,需要大家有充分清晰而又理性地認知。 ”他表示。
劉慶峰直言,“今天人工智能技術的發展絕不是一家公司可以把所有事情都做完的,在這個時代,做帝國注定要衰落,只有生態才能生生不息;必須是自主可控的繁榮生態,才有中國通用人工智能大未來,我們要打造新的生態,包括源頭技術生態、應用生態還有行業生態。”
“我們既要認識到差距,又要有充分的信心,要能夠科學理性地給出從源頭技術、到生態、到產業應用落地的一整套打法,要以長期主義來打造真正自主可控的AI產業生態。”他說道。
根據大會信息,從今年1月30日訊飛星火V3.5發布以來,大模型开發者團隊目前已經增長到702萬,海外开發者數量從34萬增加到40萬,大模型的直接相關开發者達到了57萬。
標題:科大訊飛董事長:科學理性認識中美科技綜合差距,絕不能盲目自信
地址:https://www.utechfun.com/post/391008.html