騰訊元寶首發體驗:與字節豆包各有千秋,殺手鐗功能尚缺

2024-05-31 18:40:21    編輯: robot
導讀 “騰訊做大模型不爭一時之先。” 這兩年AI大模型賽道迎來了應用的大規模落地,國內市場湧現出不少面向用戶端的優秀應用,比如昆侖萬維的天工AI、字節跳動的豆包、阿裏巴巴的通義千問、百度的文心一言等。而互...

“騰訊做大模型不爭一時之先。”

這兩年AI大模型賽道迎來了應用的大規模落地,國內市場湧現出不少面向用戶端的優秀應用,比如昆侖萬維的天工AI、字節跳動的豆包、阿裏巴巴的通義千問、百度的文心一言等。而互聯網科技巨頭之一的騰訊卻顯得有些低調,盡管也有推出混元大模型以及小程序測試版本,但仍欠缺一款真正面向用戶端的AI應用。

但該來的終究會來,騰訊出品的AI大模型應用浮出水面。

5月30日,騰訊正式發布了基於混元大模型打造的App“騰訊元寶”,安卓、蘋果等各大應用商店均可下載體驗。至此,國內科技互聯網三巨頭“BAT”終於齊聚消費級AI大模型產品賽道。

圖源:雷科技

官方介紹,騰訊元寶提供AI搜索、AI總結、AI寫作、AI繪畫等特色功能,面向工作場景,它能夠解析PDF、Word、txt等多種格式的文檔,同時支持超長的上下文窗口,還能一次性解析多個網址、微信公衆號鏈接,使用戶處理工作中的復雜信息更爲高效便捷;面向生活場景,騰訊元寶也提供了AI頭像、角色扮演、口語陪練、同聲傳譯等特色AI功能,用戶還可以創建專屬自己的個人智能體。

值得一提的是,騰訊元寶的AI搜索極具“騰訊”特色,因爲它接入了微信搜一搜、搜狗搜索等搜索引擎,同時內容涵蓋了微信公衆號等騰訊生態內容及互聯網權威信源。借助騰訊的生態優勢,騰訊元寶或許能在AI搜索方面做出一定的差異化。

接下來,我們來看看騰訊元寶的實際體驗。

騰訊字節AI對決:元寶豆包各有千秋

在登錄騰訊元寶App的過程中會提示用戶選擇是否綁定微信账號。此步驟是爲了方便騰訊元寶與微信之間的實時聯動,不過或許是爲了引流,內容的分享形式是我們熟悉的卡片,其他用戶點开是這個樣子的。

圖源:微信

雖然小雷可以理解設置的初衷,但這種分享形式肯定會對其他用戶的觀感產生一定影響,不知道官方後續是否會優化,未來騰訊元寶可能還會繼續增加與微信等其他騰訊系產品之間的聯動,讓AI影響整個騰訊生態。

回到正題,騰訊元寶的UI設計十分簡潔,一個搜索框+下方浮動的AI功能便是全部。據了解,信息獲取、處理以及產出是騰訊元寶重點關注的應用場景,分別對應着App中的AI搜索、AI總結、AI寫作/繪圖。既然如此,我們就先來體驗這幾個功能,看看騰訊元寶的實力。

爲了體現元寶的AI實力,小雷決定請出之前體驗過的豆包,豆包將在下列體驗過程中隨機出現,或許這樣能更好看出雙方在AI應用產品邏輯上的差異。

圖源:元寶

1、AI搜索:豆包總結提煉優秀、元寶連續對話更強

雷科技作爲專注AI硬科技的新媒體,謙虛點說在全網範圍內還是具有一定知名度的。我們就以雷科技爲題,給元寶先熱熱身。回答還真給小雷帶來不少驚喜,對於雷科技的介紹相當全面,從成立時間到主要業務,再到發展過程中的關鍵節點和行業影響力,都有提及並且有不錯的准確度。

圖源:元寶

唯二的小缺點,一是雷科技的最新Slogan是“專注AI硬科技”,這點元寶沒有從我們發布的文章中識別到;二是少了雷科技的最新數據,比如雷科技公衆號已經突破180萬,行業影響力正不斷提升。

總的來說,元寶回答已經相當不錯了,讓小雷對接下來的體驗充滿期待。

蘋果WWDC 2024臨近,小雷就大會开始時間向元寶提問,3秒左右就輸出了回答。除了小雷提問的時間外,元寶還擴展了預計發布的新軟件版本、活動地點以及與問題有關的推薦文章,同時支持用戶直接點擊跳轉參考資料。

由於小雷昨天剛寫了篇相關文章,因此對WWDC 2024信息比較熟悉,核對回答後並沒有發現錯誤。爲了繼續考驗元寶的多輪對話能力,小雷繼續提出了將回答整合成文章和擴充文章中關於新軟件版本的特性。

圖源:元寶

第一個指令是“整合文章”,小雷認爲是合格的。元寶在原回答的基礎上,補充了標題、开頭、總結,讓回答看起來更像一篇文章,但在新軟件版本段落,回答依舊停留在簡單羅列的程度,這也是小雷提出第二個指令“擴充文章中關於新軟件版本的特性”的原因。

關於第二個指令,元寶的表現則有些讓人失望。雖然AI精准識別了指令並針對每個軟件系統進行了解讀,但解讀內容的准確度卻不高。以iOS 18爲例,最大的看點AI沒有提及,相關內容很早之前就全網瘋傳了,以AI搜索的能力,應該不會發現不了吧。

圖源:元寶

面對同樣的問題,豆包的回答更加精簡,時間、軟件等信息點都沒有出錯。對於軟件系統可能出現的更新,豆包的回答要准確些,提及了AI、RCS等iOS 18更新熱點。

總的來說,元寶回答更豐富全面,可以爲用戶提供更多思路;而豆包回答重點放在精准上,也就是用戶問什么就回答什么。兩者並無優劣之分,產品邏輯決定了AI回答的側重點。

圖源:豆包

2、AI文章總結:元寶主打言簡意賅,豆包主攻信息拓展

既然元寶關於WWDC 2024的擴寫還有待提高,那么就讓它來總結下小雷寫的WWDC 2024文章吧,希望其他用戶問同樣問題的時候,元寶能想起來雷科技的解讀。

輸入公衆號文章鏈接和指令,元寶很快給出了文章總結。經過小雷仔細對比,總結精准度值得肯定,對文章的不同部分都進行了歸納,基本還原了文章的大意,在小雷體驗過的一衆AI應用中,絕對在平均水平以上。

圖源:元寶

豆包和元寶的總結歸納基本一致,只是在關鍵信息的羅列上具有些許差異,不影響閱讀和理解。雙方最大的差別在於,元寶的文章總結更精准,也就是言簡意賅。而豆包提供了文章的標題、標籤以及拓展討論。

值得注意的是,拓展討論並不是小雷文章的內容,而是豆包根據文章自動生成的,小雷認爲這點是值得肯定的,雖然總結是用戶指令的第一需求,但能在完成A之余,提供B甚至是C的回答,是不錯的加分項。相比起豆包,元寶在這方面還有提升空間。

圖源:豆包

3、AI生成:豆包效率高、元寶風險意識強

圖/文創作是用戶使用頻率較高的AI功能,這往往決定了用戶對某個AI應用的直觀印象。

在文章創作方面,小雷要求元寶寫一篇關於智能手表的行業分析。從文章結構來看,小雷覺得沒有太多可挑剔的地方,換作是我來寫,大概率也是從行業概述、市場規模、當前競爭格局、行業趨勢、行業挑战等方向進行逐步分析。當然也有需要優化的地方,比如文章內容有些太籠統寬泛了,適當增加具體數據和案例會更像人們日常的寫作習慣。

不過,優化完全可以在當前對話框進行,小雷嘗試要求元寶爲文章不同部分增加真實數據、健康管理應用、價格等內容,一番操作下來文章比起最初版本要豐滿不少,雖然距離小雷平時寫作還有一定距離,但至少可以拿來充當框架,畢竟往裏面填充內容可比自己思考要快得多。

圖源:元寶

圖片創作方面,小雷分別嘗試生成了不同主體、不同風格的圖片,先給大家看看效果。

圖源:元寶

不知道大家如何評價元寶的AI繪畫功能,小雷個人認爲還是挺滿意的,至少人像面部特徵清晰、背景自然、關鍵詞識別率高這幾點的表現相當不錯。隨着體驗的深入,小雷嘗試給元寶繪圖加入更具體的指令,元寶的表現也沒有讓人失望,關鍵詞中的動作、服裝、場景統統識別。

圖源:元寶

小雷注意到元寶繪圖有一個非常好的設定:版權保護。原本小雷想生成一張惡搞圖片,但試了幾次元寶都提示無法提供相關信息,起初我還以爲是AI識別的問題,但後面切換了“海綿寶寶”關鍵詞,就能正常生成了。後面小雷又試了幾個比較出名的IP,發現也是同樣的結果。

可以看出,騰訊在版權方面還是相當謹慎的,這樣一來,就能降低用戶使用AI創作產生的版權風險。

圖源:元寶

 寫在最後

一番體驗下來,騰訊元寶三大核心AI功能確實帶給小雷不少驚喜。但作爲面向用戶的AI大模型應用,騰訊元寶可能還欠缺一個讓人印象深刻的“明星功能”,比如Kimi的長文本處理、Remini的黏土濾鏡等等,這些功能相當於應用的記憶錨點,用戶只要提前相關功能,第一個想起的必定是它們。

而騰訊元寶目前主打的AI搜索、AI總結解析、AI創作及其他AI智能體,可能在水平上絲毫不遜色於其他AI大模型應用,甚至領先,但確實還未達到巨大差異的程度。

不過,騰訊元寶今天才正式發布,留給騰訊迭代優化的時間還有很多很多。就像騰訊雲副總裁、騰訊混元大模型負責人劉煜宏說的那樣:“騰訊做大模型不爭一時之先。”,這也是過去一年,騰訊混元大模型選擇在更多業務場景中打磨技術,洞察用戶真實需求的原因。

相關數據顯示,當前人們使用大模型相關應用時,有超過65%的需求集中在工作、學習效率場景。騰訊元寶定位准確,接下來要做的就是加強大模型的硬實力,以及找到更多實際的場景化需求。

大模型應用市場仍在快速發展期,一款功能強大、易於使用的AI大模型應用,能在自然語境下提供智能化的回答和建議,能爲用戶帶來了便利和高效的智能體驗,小雷相信這也是騰訊元寶的終究目標。

來源:雷科技

       原文標題 : 騰訊元寶首發體驗:與字節豆包各有千秋,殺手鐗功能尚缺



標題:騰訊元寶首發體驗:與字節豆包各有千秋,殺手鐗功能尚缺

地址:https://www.utechfun.com/post/378262.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡