9.11和9.9大模型全錯,場景將成AI搜索護城河

2024-07-26 18:41:39    編輯: robot
導讀 前言: 根據全球研究與咨詢公司Gartner於今年2月發布的報告預測,至2026年,傳統搜索引擎的搜索量預計將下降25%。 此預測凸顯了隨着生成式人工智能技術的不斷發展,人們的搜索習慣正在發生顯著變...

前言:

根據全球研究與咨詢公司Gartner於今年2月發布的報告預測,至2026年,傳統搜索引擎的搜索量預計將下降25%。

此預測凸顯了隨着生成式人工智能技術的不斷發展,人們的搜索習慣正在發生顯著變化,進而推動了AI搜索領域的快速進步。

作者 | 方文三

圖片來源 |  網 絡 

9.11與9.9的比較時大模型[犯渾]

在數學領域,比較兩個小數的大小是一個基本問題。然而,當這個問題被提出給當前的AI大模型時,卻引發了一系列的錯誤回答。

具體來說,當被問及[9.11和9.9哪個更大]時,多數AI大模型錯誤地認爲9.11大於9.9,這一錯誤源於對小數點後數字的錯誤比較。

大部分大模型在處理此類問題時,錯誤地將小數點後的數字進行比較,而忽略了整數部分的大小。

此次事件中,多個知名的AI大模型均未能正確回答這一問題,包括但不限於ChatGPT-4o、字節豆包、月之暗面kimi等。

在對12個AI大模型的測試中,只有阿裏通義千問、百度文心一言、Minimax和騰訊元寶給出了正確答案,其余8個模型均未能正確回答。

在某些場景表現不佳反映了技術的局限性

從技術層面來看,大模型在分析文本時,通常會使用特定機制將文本拆分成更小的單元進行處理,這種拆分方式在處理數學問題時可能不夠嚴謹,容易出現[斷章取義]的情況。

①AI大模型在數學能力上的不足,部分源自其技術架構的固有限制。

當前的AI大模型主要基於Transformer架構,該架構在處理序列數據時表現出色,但對數學和邏輯推理的精確性存在局限。

Transformer模型依賴於自注意力機制來捕捉輸入數據中的依賴關系。

然而,這種機制在處理數學表達式時可能無法有效捕捉數學運算的精確順序和邏輯結構。

②AI大模型通常使用浮點數來表示數值,但這種表示方式在處理小數點後的精確比較時可能會引入誤差,導致錯誤的數學判斷。

盡管大模型在訓練過程中接觸到了大量數據,但其泛化能力在數學問題上仍顯不足,特別是在處理未見過的數學問題或需要復雜推理的場景。

③大模型的設計初衷可能更側重於文字思維而非數字思維。

它們在處理自然語言時表現出色,但在應對數學這種需要精確計算和嚴格邏輯的領域時,就顯得力不從心。

④訓練數據的質量和多樣性直接影響AI大模型的數學能力。

現有訓練數據集中缺乏對數學邏輯和推理過程的描述,模型未能學習到數學問題解決的邏輯鏈條。

AI技術中場景的選擇和適配性至關重要

雖然[9.11]和[9.9]大模型可能在某些場景下遇到挑战,但將特定場景視爲AI搜索的護城河是一種具有战略意義的思考方式。

它強調了場景適配性、定制化優化和技術創新在構建競爭優勢中的重要性。

在AI搜索領域,這可能意味着通過專有技術、數據資源、用戶體驗設計等手段,構建獨特的競爭優勢。

不同的應用場景可能對模型的性能有不同的要求。

因此,將特定場景視爲AI搜索的護城河,意味着在這個特定場景下,通過優化模型或整合相關技術,可以實現更優越的用戶體驗和搜索效果。

①定制化優化:針對特定場景,可以調整和優化搜索算法,使其更符合該場景下的用戶需求和信息結構。

②數據優勢:在特定場景下積累的大量相關數據,可以用於訓練更精准的模型,從而提升搜索的准確性和效率。

③技術創新:在特定場景下不斷探索和研發新技術,如語義理解、圖像識別等,以提供更豐富的搜索功能和服務。

場景是AI搜索的長期護城河

在中國當前的搜索市場格局中,AI與搜索的融合呈現出兩種主要趨勢。

①以360和昆侖萬維爲代表的企業,通過推出[AI搜索]應用,實現了對話式搜索的創新體驗;

②如字節、騰訊、百度等公司,則選擇將自身的AI技術融入傳統搜索框中,爲用戶提供更智能的搜索服務。

其中,360AI搜索、天工AI及祕塔AI搜索在體驗上仿照了Perplexity的模式,即先給出總結性的[答案],再通過[參考資料]的形式呈現相關網頁內容。

根據AIwatch.ai發布的[全球AI產品增速黑馬榜],360AI搜索在3月份的訪問量環比增加了1677%;天工AI搜索網頁版在4月份的訪問量達到400萬,環比增長120%;

而祕塔AI搜索在推出不到兩個月的時間裏,便累積了數百萬的訪問量。

然而,隨着AI搜索熱潮的逐漸降溫,場景適用性、用戶留存等現實問題开始浮出水面,標志着行業已邁入比拼內功的新階段。

在這一階段,競爭的核心將不再局限於融資額或產品功能的極端化,而是轉向對真實用戶場景的理解和滿足。

因此,中國AI搜索市場的下半場,或將聚焦於模型之外的理解能力、爬蟲程序的邏輯思維、數據集的全面性,以及在回答時精准判斷哪些頁面對於用戶獲取准確數據最爲重要。

綜上所述,AI搜索產品並非僅具備搜索功能。原有的搜索市場參與者通過AI技術搶奪並留住用戶;

而新進入者則借助AI拓寬業務邊界,开闢通往搜索領域的新道路。

無論何種AI搜索產品,其本質目標均在於更好地滿足用戶的搜索需求,即利用AI能力爲用戶提供更精准的內容匹配。

經過對比體驗發現,當前市場上的AI搜索產品在應對泛化信息需求時表現出色,但在垂直領域的精細要求下,往往難以提供專業、准確、全面的回答。

因此,無論是原生AI搜索還是傳統搜索引擎,在追求低門檻的同時,還需注重產品差異化以形成核心競爭力。

同時,應警惕因缺乏應用場景、數據支撐和用戶基礎而導致的市場淘汰,因爲AI搜索產品的根本驅動力在於用戶需求而非技術本身。

只有在擁有成熟的應用場景和穩定的用戶留存基礎上,AI搜索的飛輪才能持續轉動。

AI搜索面臨工程化和產品化問題

①在於搜索排序算法的設計。相較於傳統搜索引擎主要依賴的基於網頁關系的算法(如PageRank),其計算過程相對簡化。

然而,AI搜索則引入了深度學習、強化學習等高級模型,這要求在海量數據上執行大規模訓練與優化,對算法的性能提出了極高的標准。

據統計,搜索引擎每日需響應數十億次查詢請求,而當前主流的大型語言模型在每次查詢時均需執行數十次參數計算,這無疑加劇了整個過程的難度與復雜性。

②實時輸出成爲另一關鍵挑战。隨着用戶對搜索結果實時性要求的提升,任何明顯的延遲都將嚴重影響用戶體驗。

然而,大型模型因其推理過程而常導致反應時間相對較長。

例如,谷歌的LaMDA對話模型在單次交互中,因涉及大量自然語言推理與生成,其計算延遲往往達到數秒,這對於搜索場景下的即時響應需求構成了顯著挑战。

③推理准確度是AI搜索的另一核心要求。在極短時間內完成復雜的邏輯推理,以提供最爲精准的搜索結果,這既需要算法具備高效的計算能力,又需能夠妥善處理模糊與多義的查詢。

結尾:

在可預見的未來,隨着AIPC、AI手機等智能設備的日益普及,AI搜索有望成爲這些設備的核心功能構成部分。

這些設備將預裝AI搜索引擎,進而將搜索流量從傳統瀏覽器遷移至AIPC、AI手機等平台。

此舉不僅將重塑傳統搜索行業的格局,確立AI搜索爲流量匯聚的主要渠道;

而且,通過語音或手勢與AI搜索進行交互,用戶將享受到更爲自然、高效的信息檢索體驗。

部分資料參考:第一財經:《AI算不出9.11和9.9哪個大?六家大模型廠商總結了這些原因》,科技新和:《AI搜索新貴彎道超車難》,周天財經:《AI搜索之战:誰在成爲中國的Perplexity》,AI科技評論:《AI搜索熱潮背後:注定要逾越場景的門檻》,技術領導力:《AI搜索,正在殺死傳統搜索》

       原文標題 : AI芯天下丨產業丨9.11和9.9大模型全錯,場景將成AI搜索護城河



標題:9.11和9.9大模型全錯,場景將成AI搜索護城河

地址:https://www.utechfun.com/post/402486.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡