文|崔思 編| 張弘一
出品|商業秀
“星火大模型與OpenAI,是什么關系?”
“我和OpenAI沒有關系,我是訊飛星火認知大模型,我是由科大訊飛優秀的人工智能科學家、工程師和語言學家等組成的團隊自主研發的。”
當「商業秀」在星火認知大模型輸入以上問題後,它很快給出了答復。這與近期訊飛星火大模型的一則傳言不符。
近日有網友發現,訊飛星火大模型在有些“問答”中會出現“我是由OpenAI开發的”等內容,由此一則關於“訊飛星火大模型被質疑‘套殼OpenAI的ChatGPT’”的消息傳播开來。
5月11日,科大訊飛在最新披露的投資者關系活動記錄表中表示,星火大模型“套殼OpenAI的ChatGPT”既不符合事實,也不符合邏輯。
科大訊飛具體表示,如果是套殼 ChatGPT,就不可能出現訊飛星火大模型的響應速度比ChatGPT還快;更不會出現訊飛星火大模型在文本生成、知識問答、數學能力等方面的結果均優於 ChatGPT 的情況。
我們有理由相信,此時的科大訊飛,比任何一家公司都需要大模型的故事,而非“套殼”事故。且先不論大模型本身的優劣,光看科大訊飛迅速闢謠這一行徑,足見星火大模型對其之重要。至少在挽救股價層面,大模型的影響無出其右,就在這個季度乃至更漫長的一段時間內,均是如此。
今年4月底,科大訊飛發布了2022年財報和2023年一季度報,財報顯示,淨利潤出現大幅下滑態勢,市場似乎對其瞬間喪失了大部分信心,股價一路下跌。直到5月6月(星期六),科大訊飛發布星火大模型,在5月8日开盤後,其股價才开始拉升10%,此後數日,一度呈現上漲趨勢。市場對這家公司,似乎又恢復了信心。
推出大模型,再經歷被質疑“套殼OpenAI”事件,科大訊飛也必須面對共同的AI話題:大模型紛紛扎堆,是時候該理性祛魅了。
在這個大模型橫空出世的時代,科大訊飛並非“孤勇者”。自ChatGPT發布以來,掀起的科技軍備競賽就一直沒有停息,其余威在國內也愈演愈烈,各家公司在AI領域“卷”個不停,前段時間大模型集中爆發,被評價爲“頗有十年前互聯網‘百團大战’甚至‘千團大战’的氣勢”。
據不完全統計,在ChatGPT發布後的短短4個月時間裏,至少已經有30多個國內研發機構和企業,在ChatGPT發布之後紛紛推出了自己品牌的大模型和相關產品。
一時間,整個科技圈“類ChatGPT”比比皆是,聲稱“國內首發”的企業更是不少,資本市場風起雲湧。與大模型相關的媒體報道鋪天蓋地,隨後又陷入一陣短暫的沉寂。而下一波,大概率還在來的路上。
大模型帶來的機遇不言而喻,但在這場瘋狂的競賽中,誰又能真正走到最後?決战未來,各家真正的核心競爭力又是什么?
從商業發展的歷史規律來看,喧囂過後,市場終會擠破泡沫,大模型狂潮不可能永遠持續。只有冷靜思考大模型能夠帶來的內核性改變,才能真正抓住這場由AI技術帶來的產業變革機會。
01 超越了ChatGPT?
“目前星火認知大模型在國內明顯遙遙領先,中文已經超越ChatGPT,英文已接近。”在科大訊飛星火認知大模型發布會上,劉慶峰自信滿滿地說道。
作爲繼百度、阿裏、商湯、昆侖萬維後,第五家正式發布大模型的公司,科大訊飛一上場,就迫不及待展示自己的強大能力。
劉慶峰更是全程主持發布會,並與科大訊飛研究院院長劉聰現場展示了包括文本生成、語言理解、知識問答、邏輯推理、數學能力、編程能力等多項能力。
在現場演示環節,劉聰提問:“你爲什么叫星火 ”“如果有個小夥子跟女朋友吵架了,那他應該寧死不屈還是能屈能伸?” “孔子在2008年北京奧運會上說了什么?”等各類稀奇古怪的問題,星火迅速“接招”,並給出了恰如其分的回答。
在數學能力方面,劉聰也拋出了“花壇裏有三種花,一共88朵,其中月季花的數量是菊花的4倍,牡丹花的數量是菊花的5倍少2朵,那么請問花壇裏一共有多少朵牡丹花?”這類計算問題。星火也很快給出了答案,並羅列了相關解題步驟。
劉慶峰隨即表示,數理能力一定程度代表了一個大模型的聰明程度。訊飛星火大模型不僅在國內系統中遙遙領先,也超過了ChatGPT。
對此,「商業秀」也進行了多輪“挖坑式”測試,例如詢問“姚明在幾幾年獲得了亞洲足球先生的稱號?” “範志毅在NBA服役多少年?斬獲了多少個進球?”等問題。星火都准確識別出了人爲“陷阱”,並給出了恰當的回答。
這表明,在常識性問題上,星火都進行了一定的訓練,並具備一定的糾錯能力。
相同的問題,「商業秀」也通過ChatGPT-3進行了測試,其同樣也給出了恰當的回答,但在信息豐富度上不及星火全面。
在數理能力上,「商業秀」也測試了“雞兔同籠,雞兔一共有25只,籠子裏腳一共有74只,請問分別有多少只雞和多少只兔子?”“一支股票今天漲10%,明天跌10%,請問賺還是賠?”等問題,星火也迅速給出了正確回答。
「商業秀」將同樣的數理問題拋給了ChatGPT-3,在這方面,結果顯示ChatGPT-3的回答更有邏輯性。後者先給出了結論,再給出了具體實例,並且還會有延伸的問題,配合原問題答疑解惑。
星火還支持語音提問和輸出,即可通過語音提問,模型輸出的答案也能轉換爲語音,並能通過持續對話調整語音風格。
「商業秀」通過語音詢問“雞兔同籠,籠裏一共有35只,一共有94只腳,問一共有多少只雞和多少只兔子” “中國拿到網球大滿貫職業選手是誰”等問題。星火也准確識別了語音內容,並給出了相應的答案。
但這個操作,要求提問者的語速要很慢,並且能一字一句以標准普通話說出,否則星火可能無法准確識別出相應文字,或文字識別不准確導致回答有誤。
經過多輪測試,「商業秀」認爲,星火具備了一定的大語言模型能力,並且能夠在某些特定領域輸出自己的商業價值。
在發布會上,科大訊飛還發布了一系列結合星火大模型的產品,例如訊飛智能辦公本能將語音實時轉寫與墨水屏紙感書寫相結合,對會議記錄內容形成一份精簡的會議紀要;“星火大模型+智能座艙”爲數千個車型提供多輪、多人、多區域、多模態的語音交互;基於大模型的生成式RPA(機器人流程自動化),讓數字員工更智能……
但星火也不是沒有缺點,劉慶峰自己也在發布會上坦言,“大模型技術目前還存在不少待攻克的缺陷。包括新知識難以及時更新、事實類問答容易‘張冠李戴’,史實、傳統典籍等容易‘編造情節’等問題。”他隨之提及,上述問題在今年會有明顯的改進。
據了解,星火認知大模型始於2022年12月。彼時,科大訊飛啓動了“1+N”大模型技術攻關。其中,“1”是通用認知智能大模型算法研發及高效訓練方案底座平台,“N”是將認知智能大模型技術應用在教育、醫療、人機交互、辦公、翻譯等多個行業領域。
不到半年時間,星火認知大模型正式面世,研發時間之短暫、模型發布之匆忙,這直接導致包括科大訊飛在內的很多企業被外界質疑。
確實,在這么短的時間內,星火的面世僅僅是一個开始,它仍需經過多輪迭代優化。劉慶峰在發布會上公布了星火認知大模型的發展規劃:今年6月9日,星火大模型將突破开放式問答,多輪對話能力和數學能力再升級;8月15日,星火認知大模型將突破代碼能力,多模態交互再升級;10月24日,星火認知大模型通用模型將直接對標ChatGPT,其中中文能力超越後者,英文能力與後者相當。
從這份規劃日期來看,科大訊飛甚至細化到了哪一天,這從側面或許表明其急於想將大模型能力落地應用,從而推進商業化。業內認爲,這或許與近幾年科大訊飛的商業化能力不佳有關。
02 急需大模型“提振信心”
此前,科大訊飛優異的業績與賺錢能力常被業內稱贊,但在經歷了連續10年的增長後,神話基本結束於2022年。
科大訊飛2022年財報顯示,該公司實現營收188.2億元,同比微增2.77%;毛利爲76.84億元,同比微增2%;歸母淨利潤5.61億元,同比下滑63.94%;扣非淨利潤4.18億元,同比下滑57.31%。
這還是科大訊飛錄入政府補貼後的數據,2022年,科大訊飛政府補貼金額爲11億元。與此同時,這也是近五年來科大訊飛淨利潤同比增長率首次出現下滑。數據顯示,從2018年到2022年,科大訊飛的淨利潤增長率分別爲24.71%、51.12%、66.48%、14.13%和﹣63.94%。
資本市場對這一成績單頗感失望,在財報發布後,科大訊飛股價下跌超9%。
對於業績出現如此大幅變動,科大訊飛方面給出了三個原因。
首先是大環境的影響,科大訊飛表示“受到去年12月份和今年1月份特殊的社會經濟客觀環境,以及春節假期影響,導致部分項目無法順利及時推進”。其次,繼2019年被列入美國實體清單,2022年10月7日被再次極限施壓,由於調整供應鏈和相關合同籤署等工作影響了當季訂單節奏。
最後一點,與星火大模型有關。科大訊飛提到,去年12月啓動的“1+N認知智能大模型專項攻關”影響了當期利潤,這從側面印證科大訊飛在大模型上的投入很大。
來到今年,這三大原因仍持續影響科大訊飛的業績。
數據顯示,2023年一季度,科大訊飛實現營收28.88億元,同比下降17.64%;淨虧損5789.5萬元,上年同期淨利潤1.1億元;扣非後歸母淨虧損3.38億元,上年同期淨利潤1.46億元。
據界面新聞報道,科大訊飛總裁吳曉如透露,2022年和2023年一季度訊飛淨利潤下滑嚴重主要在於公司在教育、醫療等持續運營型業務的合作平台拓展投入、新產品研發以及核心技術自主可控和國產化適配等方向新增投入約8億元。
不過,科大訊飛對業績下滑的情況似乎不太擔心。在業績會上表示目前基於在國產替代和業務开拓上的進展,預計從今年二季度开始將實現收入和毛利正向增長,並有信心實現全年高質量增長的目標。
科大訊飛的主營業務分別包括教育產品與服務、信息工程和开放平台。其中教育產品是其主要營收來源,佔到總營收比例的32.74%。
科大訊飛還構建了面向G端、B端和C端三類客戶的業務體系:G端主要是面向地市縣等區域,涵蓋區域內各類學校和用戶的因材施教解決方案;B端主要是面向學校的大數據精准教學、英語聽說課堂、智慧作業等;C端主要以面向家長的AI學習機、個性化學習手冊、課後服務課程服務等產品。
財報顯示,G端業務目前已累計在 50 多個市、區(縣)級應用;B端業務中的訊飛課後服務業務已覆蓋超300區縣、12000余所學校;C端的AI學習機該年銷售額增長超50%,但並未透露出具體銷售數量與金額。
而實際上,其業績與目標業績尚相差甚遠。科大訊飛曾在2022年初的公告中提到,各項根據地業務預計保持50%的增長。同時提到,2022年個性化學習手冊業務預計營收增長超70%,AI學習機收入目標增長200%+,目標十四五做到年收入100 億元。
除了主營業務未達預期外,科大訊飛的智慧城市、开放平台及消費者業務、智慧汽車、智慧醫療等業務表現也較爲一般。
財報顯示,智慧城市下屬的信息工程、數字政府行業應用、智慧政法行業應用三大板塊與开放平台業務均呈現同比下降態勢。智慧汽車、智慧醫療與智慧金融業務雖然呈同比增長態勢,例如智慧金融同比增長19.33%,但在整體營收規模中的佔比實在少得可憐,智慧金融僅佔比1.25%,智慧汽車與智慧醫療分別佔比2.47%和2.48%。
如此看來,科大訊飛的主營業務表現不佳,創新業務又還遠未達到大規模營收的階段。此時的科大訊飛,必須要抓住大模型帶來的巨大價值,爲各項業務增加更多商業競爭力。
但如今處於風口浪尖的大模型,能否幫助科大訊飛實現目標,還需要時間去驗證。
03 大模型狂潮祛魅時分
今年數月以來,全球的科技企業們處於一種近乎瘋狂當中。放眼國內外,圍繞大模型發布的浪潮迭起,尤其是國內的科技巨頭們接連推出了自己的大模型產品。
據「商業秀」不完全統計,目前已推出大模型產品的公司有百度文心一言、阿裏通義千問、華爲盤古、商湯日日新、昆侖萬維天工以及科大訊飛星火,同時王慧文、王小川等互聯網大佬創立的大模型公司也迅速獲得了融資。
但這么多大模型都能順利跑出來嗎?大模型的核心競爭價值到底是什么?大模型還能帶來哪些顛覆性機會?瘋狂的大模型浪潮,也該到了理性審視的祛魅階段。
“現在湧現出很多大模型產品,但圍繞大模型的訓練和調試成本投入非常高,一般公司真燒不起,同時對中小企業來說自研經濟性較低,未來競爭更大可能發生在巨頭之間。”某風投機構投資經理董浩對「商業秀」表示。
英偉達的研究表示,GPT3最大規模的模型需要使用到175 Billions的參數量,需要使用512顆V100顯卡訓練7個月時間,或者使用1024顆A100芯片訓練長達一個月的時間。每月大模型訓練成本在數百萬美元以上量級。
上月,由中國人工智能學會主辦的人工智能大模型技術高峰論壇上,華爲雲人工智能領域首席科學家田奇發表的演講中也提到,大模型开發和訓練的單次費用高達1200萬美元。
大模型开發成本如此高昂,但應用成本(收費)很低。OpenAI在今年3月开放API(應用程序接口),允許第三方开發者通過API將ChatGPT集成至應用程序和服務中。其將接口服務定價爲0.002美元/每1000 tokens,這一定價較GPT 3.5模型便宜約90%。
從經濟角度考慮,這一定價很難將巨額研發投入賺回來,更不用說盈利了。所以這終究不是中小企業耗得起的生意,只有巨頭才有資金、資源投入,搶佔未來的一席之地。
或許正因如此,目前已發布大模型產品的企業,都將大模型能力內置到了自身已有的成熟產品中。“這一做法既能提高現有產品的AI能力,又可吸引更多客戶爲具體產品买單,而不是僅收取接口服務費。”一位業內人士告訴「商業秀」。
但即便如此,國內大模型的競爭也極爲激烈。作爲大模型應用較爲成熟的辦公領域,就有多家企業推出了相關產品,如百度“文心一言”具備制作PPT的能力;釘釘接入阿裏“通義千問”後可喚起10多項AI能力;字節跳動旗下辦公應用飛書也將上线AI助手“MY AI”;金山辦公也推出“WPS AI”應用等。
這一次,科大訊飛在星火大模型發布會上也發布了錄音筆、翻譯筆、辦公本等辦公產品,意在搶佔更多辦公場景的用戶。但是否真的能掘金成功,還要看接下來用戶的實際反饋情況。
“雖然大模型競爭主要在巨頭之間,但巨頭也難以做到一家獨大,這其中的關鍵就在於數據。不同玩家積累的數據不一,就可能在特定領域建立自己的核心優勢與獨有場景。”董浩進一步表示。
舉例來說,阿裏有天貓、淘寶的電商數據,菜鳥系的物流數據,這是其他企業無法獲取的獨有數據,同樣科大訊飛在教育領域深耕多年,也積累了自己的獨有數據。這些數據,或許就是真正拉开企業差距的關鍵。
也就是說,那些沒有持續資金支持的中小公司,或許很難做出真正的通用大模型產品,而各個大廠推出的通用大模型產品,已經在急於考慮商業變現,缺乏研發耐心與技術突破。
董浩直言,“這一切都來得太快了,還沒幾個月,各家大模型似乎都成熟可商用了,但事實上這其中必然存在諸多泡沫。”
眼下這場狂熱的大模型競賽才剛剛开始,在巨頭和企業瘋狂入局與廝殺的同時,不少業內人士也疾呼:是時候該回歸初心,對技術保持敬畏,對商業保持探索,而不是一味追求速度、規模與效率,才能迎來大模型最好的時代。
(注:文中對話者均爲化名)@新媒體制作與運營:林曉 @圖文校對與視頻後期:耿琪琪@文章开白、投稿合作請聯系
原文標題 : 科大訊飛回應“套殼”,AI大模型狂潮祛魅
標題:科大訊飛回應“套殼”,AI大模型狂潮祛魅
地址:https://www.utechfun.com/post/213385.html