實測訊飛星火App：沒有感情、只有公式

2023-06-25 18:40:23 編輯： robot

導讀作者｜孫鵬越編輯｜大風自2022年11月OpenAI推出ChatGPT以後，一場波及全球科技的“海嘯”就此爆發。國產AI大模型成了2023年上半年最火熱的項目，僅僅在4月份，就有二三十家...

作者｜孫鵬越

編輯｜大風

自2022年11月OpenAI推出ChatGPT以後，一場波及全球科技的“海嘯”就此爆發。

國產AI大模型成了2023年上半年最火熱的項目，僅僅在4月份，就有二三十家大模型宣布成立，其中不乏阿裏巴巴通義千問、華爲雲盤古、360GPT、昆侖萬維“天工”大模型、京東言犀、知乎“知海圖 AI”等互聯網巨頭。

2023年5月6日，科大訊飛發布“訊飛星火”認知大模型，正式加入了AI大模型的“千模大战”。

僅過了一個月的時間，在6月14日，訊飛星火大模型正式內測，並上线IOS和安卓版本，可以說科大訊飛的AI研發速度異常迅捷。

但“閃電战”的背後則是高昂的“軍備”。訊飛星火的开發耗費了巨額硬件成本和开發費用，甚至一度影響了科大訊飛2023年Q1季度的當期利潤。

在科大訊飛財報淨利潤持續走低的當下，現金流已經喫緊，對AI大模型後續的研發和升級都需要持續燒錢，這對科大訊飛來講也是不小的挑战。

實測訊飛星火

目前在AppStore上，訊飛星火App版本爲1.0.06，已經累計362個評價，評分高達4.8。

訊飛星火仍處於內測狀態，需要注冊账號之後，填寫申請表，並寫下自己所在公司才能提交申請，最後由科大訊飛審核通過後才能使用。

訊飛星火官網

訊飛星火主要推出的五種使用場景爲：語言理解、知識問答、邏輯推理、數學題解答、代碼理解與編寫，每個場景下又細分出十幾個到幾十個不同的功能。

科大訊飛對於訊飛星火的數學能力頗爲推崇，鋅財經分別提問了一道七年級數學題和高考數學題，以實測了一下關於訊飛星火解析數學題的能力。訊飛星火均回應出正確答案：

鋅財經實測

緊接着測試代碼理解與編寫，讓訊飛星火寫一個俄羅斯方塊的程序代碼，訊飛星火也能做出立即響應：

鋅財經實測

但對於文章撰寫方面，訊飛星火卻頗爲喫力，鋅財經給出一個明確的寫作背景，但是訊飛星火並沒有構思出通順的故事情節，反而有種東拼西湊的矛盾感：

鋅財經實測

同時，在測試訊飛星火情感理解和邏輯推理的提問：有兩個小姑娘，Sally和Anne，她們每個人都有一個箱子，Sally的箱子裏有一顆玻璃珠子，但是Anne沒有；有一天，Sally出門了，Anne偷偷打开了Sally的箱子，偷走了玻璃珠子放進了自己的箱子裏，那么，等到Sally回到家裏要找自己的珠子，她應該去誰的箱子裏找？

鋅財經實測

如果一個人有健全的讀心能力，那么他應該能想到：“Sally是不知道Anne偷了自己的珠子的，所以肯定會先去自己的箱子裏找”；而訊飛星火則是上帝視角行動，所以會認爲Sally要去Anne的箱子裏找。

通過對比正常人類和訊飛星火截然相反的回答，我們能清晰的得知，訊飛星火在情感理解和邏輯推理仍有較大的空缺。

綜上測試可以發現，在數學和編程方面，訊飛星火的算力都處於大模型產品的前列，在互聯網上能搜索到答案的問題都能立即響應給予准確答案。但是在文章撰寫、情感和邏輯上，訊飛星火還是能很明顯看到生硬的AI邏輯。

套殼還是創新？

雖然訊飛星火已經是國產AI大模型的佼佼者，但外界對於它的質疑從未停歇。其中，質疑聲最大的傳聞，就是訊飛星火“套殼”ChatGPT。

5月9日，網上一段關於訊飛星火的群聊記錄在各個群廣爲流傳，一張截圖顯示，得到內測資格的提問者咨詢訊飛星火：“你的开發API哪裏可以看到?”訊飛星火則表示：“是的，我是由OpenAI开發的”。

一時間引發軒然大波，不少用戶調侃訊飛星火：“國外一开源，國內創新遍地开花。”並將其與“總线事件”掛鉤，也就是指某些公司在开發對話AI時直接使用已經存在的模型或代碼，而非自己研究开發，從而導致產品的質量和創新性受到質疑。

面對質疑聲，科大訊飛回應稱：“這種說法既不符合事實，也不符合邏輯。訊飛星火大模型是基於科大訊飛自主研發的深度學習框架XDL和自主搭建的超算平台X-Brain構建的，兩者之間並不存在“套殼”關系。”

是“套殼”還是“創新”，AI大模型就像是著名哲學問題“忒修斯之船”：如果忒修斯的船上的木頭被逐漸替換，直到所有的木頭都不是原來的木頭，那這艘船還是原來的那艘船嗎？

把別人开源的模型拿過來直接用，在自然語言處理科研領域是很常見的的做法，但如果“借鑑”了ChatGPT，那還算是原創的大模型嗎？

推出大模型，再經歷被質疑“套殼OpenAI”事件，科大訊飛想要殺出重圍不容易，但它太需要一個落地的AI大模型產品來振奮市場了。

來源：科大訊飛

2023年4月20日，科大訊飛發布2022年全年財報：營收188.20億元，同比微增2.77%；淨利5.61億元，同比下滑63.94%；扣非後歸母淨利4.18億元，同比下滑57.31%。

這份堪稱“差生成績單”的財報，一舉打破科大訊飛多項紀錄：營收增速個位數，打破了2012年起連續10年的兩位數增態；淨利腰斬，打破了2018年以來的四連增。

2022年的寒氣一直吹到了2023年。據科大訊飛2023年Q1季度財報顯示：實現營業收入28.88億元，同比下降17.64%；淨利潤虧損5790萬元，同比下降152.25%，扣非後歸母淨虧損3.38億元，去年同期爲1.46億元。

除了虧損，科大訊飛的現金流也頗爲緊張。

財報顯示，2023年Q1季度公司資產負債比率爲48.73%，負債合計金額近150億，其中應付票據及應付账款高達63億元；Q1季度現金流金額爲-166.84億元，科大訊飛的資金壓力較大。

在發布這份“差生成績單”的第二天，科大訊飛股價大幅跳水9%。無奈之下，科大訊飛只好宣布即將推出認知大模型“星火”，全力押寶AI大模型，才讓股價重新上漲。

訊飛星火，成了科大訊飛的救命稻草。

押寶AI大模型

2022年12月15日，科大訊飛正式啓動“1+N”認知大模型專項攻關，其中“1”就是指通用認知智能大模型，“N”就是大模型在教育、辦公、汽車、人機交互等各個領域的落地。

爲了大模型，科大訊飛在今年Q1季度研發投入高達7.157億，可謂是下了血本。

爲了不讓巨額投資打了水漂，科大訊飛爲訊飛星火搖旗吶喊，不斷在公开場合稱贊訊飛星火的算力強大。據公开信息統計，訊飛星火手機版本上线的前後幾天裏，科大訊飛股價再度拉升近17%，6月14日收盤價達到75.13元，股價創歷史新高。

雖然依靠資本市場對於AI大模型的熱度，讓不斷下探的財報有了喘息之機。但AI大模型並不是“喫草的牛”，反而是“喫肉的狼”。

來源：科大訊飛

據了解，大模型所需要的硬件成本極爲高昂，上一代GPT-3模型需要1024張A100 GPU芯片才能支撐起一次訓練，OpenAI至少需要32400張A100芯片用於日常推理，單ChatGPT硬件成本，就高達8億美元以上。

訊飛星火开了個好頭，但保持一定算力水准仍然需要後續不斷的升級、不斷持續的投入。

按照科大訊飛官方公布的消息，星火認知大模型今年的產品規劃如下：6月9日：突破开放式問答、多輪對話能力再升級、數學能力再升級（已完成）；8月15日：突破代碼能力、多模態交互再升級；10月24日：通用模型對標ChatGPT (中文超越，英文相當) ……

而每一次的升級，背後都是數以億計的研發費用和硬件成本，無疑是科大訊飛沉重的包袱。

原文標題 : 實測訊飛星火App：沒有感情、只有公式

標題：實測訊飛星火App：沒有感情、只有公式

地址：https://www.utechfun.com/post/229724.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：訊飛星火科大訊飛

上一篇:科技行業研報：中美自動駕駛走出了不同路线

下一篇:AI+機器人的核心投資邏輯到底是什么？

您現在的位置：首頁人工智能

實測訊飛星火App：沒有感情、只有公式

猜你喜歡

您現在的位置： 首頁 人工智能

猜你喜歡

您現在的位置：首頁人工智能