用上大模型的「直答」，能讓知乎答案更靠譜嗎？

2024-07-02 18:42:21 編輯： robot

導讀還不完善，但真的有用。如果說 2023 年，AI 大模型給所有人都帶來了一種前所未有的震撼，那么到了 2024 年，這種震撼毫無意外地有所削弱，AI 大模型競爭的核心焦點已經轉移到了落地的應用上：...

還不完善，但真的有用。

如果說 2023 年，AI 大模型給所有人都帶來了一種前所未有的震撼，那么到了 2024 年，這種震撼毫無意外地有所削弱，AI 大模型競爭的核心焦點已經轉移到了落地的應用上：

得讓更多人真正地用起來。

在前幾天舉辦的 2024 知乎第十屆鹽 Club 新知青年大會上，知乎正式發布了一款新的 AI 大模型產品「知乎直答」，底層基於知乎自主訓練的「知海圖 AI」大模型。

不過嚴格來說，「知乎直答」並不新。

早在今年 3 月舉辦的 2024 知乎發現大會上，知乎其實就發布了 AI 功能「發現·AI 搜索」。在官方表述中，「發現·AI 搜索」是以社區可信賴內容爲來源，給用戶帶來集新搜索、實時問答和追問功能於一體的全新體驗。

這個表述基本可以套用在「知乎直答」上，區別在於從「以社區可信賴內容爲來源」轉變到了「以知乎社區的優質內容爲核心，多種數據源爲輔助」，還從依附知乎的一個功能正式升級爲一個擁有獨立域名（zhida.ai）的獨立產品。

但對於普通用戶，更關心的問題可能還是：作爲一款 AI 大模型產品，「知乎直答」真的可以如官方所言，「爲大家提供一種全新的獲取可靠信息的途徑」嗎？以及比起其他類似的 AI 搜索產品，以知乎社區內容爲核心的「知乎直答」又有什么優勢？

一切都要「實踐出真知」。

“AI 搜索”只是皮囊，知乎內容才是靈魂

「知乎直答」的產品設計非常簡單，也非常熟悉，一言以蔽之就是——類 Perplexity 的 AI 搜索設計。國內外很多 AI 搜索產品也都採用了這一設計，原因倒也不復雜：好用，也夠用。

圖/雷科技

進入主頁，正中間是最核心的提問框，下方是問題推薦欄，作爲初上手用戶的一種引導以及提高用戶粘性的一種策略，側欄則是問答列表和用戶設置。

輸入問題後，「知乎直答」同樣也是經過「理解問題」「查找信息」，才能「生成回答」「完成回答」。完成回答後，除了能看到最終呈現的回答內容，你還可以看到前置的「參考來源」。

圖/雷科技

與此同時，你還可以繼續「深入」，追問 AI 一些問題，比如在 iPhone 16 計劃引入不鏽鋼電池外殼這個問題下，小雷繼續追問「其他廠商會用嗎？」AI 可以聯系上下文進行理解，不需要重復提及「不鏽鋼電池外殼」。

圖/雷科技

此外除了默認的「深入」模式，用戶還能選擇「簡略」模式進行提問，顧名思義就是每次輸出更少字數的回答。

而這些，也就基本構成了「知乎直答」的「皮囊」。坦白講，談不上什么驚喜，但也算得上現階段比較成熟的設計，只是有些細節需要打磨，比如在追問中選擇回答模式時，選項窗口的彈出位置等。

不過正所謂，「好看的皮囊千篇一律，有趣的靈魂萬裏挑一。」

「知乎直答」最核心的競爭力都來自知乎的海量回答，這既是中文互聯網最高質量、最重要的語料庫之一，也是一個實時更新、匯集無數用戶問答的數據庫。

簡而言之，在預訓練大模型的階段，「知海圖 AI」大模型就將高質量的知乎問答作爲核心語料進行訓練；而在「知乎直答」的落地應用上，也將知乎作爲核心數據庫用來「查找信息」，最終基於此「生成回答」。

但說歸說，最終還是要見真招的。

用上AI大模型，知乎答案會更靠譜嗎？

衆所周知，AI 大模型最強大的能力之一是對自然語言的理解，AI 搜索對比傳統搜索最大的一個優勢也是能夠更准確地理解用戶意圖。

從「理解問題」的角度，「知乎直答」確實在一定程度上體現出了 AI 大模型的優勢。比如詢問「你和祕塔 AI 搜索之間有什么區別」，能夠理解我是在問「知乎直答」和「祕塔 AI 搜索」之間的區別，並從功能定位、技術特點、用戶交互等角度進行對比。

圖/雷科技

就是祭出中文十級考題，讓「知乎直答」理解下「人要是行，幹一行行一行，一行行行行行，行行行幹哪行都行。要是不行，幹一行不行一行，一行不行行行不行，行行不行幹哪行都不行」，也能准確理解語義。

圖/雷科技

此外，「知乎直答」也能根據語境進行理解，還了解一些垂直領域的專用名詞，比如詢問「詹姆斯是 NBA 的 GOAT 嗎」，能明白是指勒布朗·詹姆斯（LeBron James），也明白 GOAT 在此處代表 NBA 歷史上最偉大的球員。

圖/雷科技

不過「知乎直答」在時間判斷上似乎存在一些問題。比如詢問五年前能准確推導到 2019 年，問十年前卻直接推導到了 2012 年（應該是 2014 年）。

圖/雷科技

另外從參考來源來看，「知乎直答」的邏輯也可能存在問題，在「查找信息」過程中更多是以「十年前」，而非「2012 年」或者「2014 年」爲關鍵詞進行查找。

這也引出了「知乎直答」在理解問題後的下一步：查找信息。

相比其他 AI 大模型產品，AI 搜索在技術上最核心的區別是基於 RAG （檢索增強生成）技術和實時聯網生成回答，除了檢索能力，另一個影響大模型生成質量的關鍵因素是數據庫。

而相比其他 AI 搜索，知乎恰恰擁有一個得天獨厚的優勢——可能是中文世界最優質的站內內容，同時在從「發現·AI 搜索」功能升級到「知乎直答」產品的過程中，知乎沒有局限於站內內容，而是擴大到了全網的可檢索內容。

比如在「C919 國產大飛機目前處於什么水准」的問題中，「知乎直答」除了找到站內的一些回答，還查閱到了不少來自媒體報道的內容，包括百度百科、澎湃新聞、政府網站、新華社等網站來源。

圖/雷科技

不過當我們使用「知乎直答」的時候，首先會有一個很多人關心的問題：「知乎直答」真的能用上知乎的回答嗎？

最簡單的回答是：用上了，而且真的做到了可追溯。

以蘋果計劃引入不鏽鋼電池外殼的問題爲例，「知乎直答」第一個回答的質量倒並未讓小雷很驚喜，包括電池能量密度的普遍提高，以及歐盟政策的影響都沒有被提及。

但「知乎直答」還是從七個方面回答了蘋果引入不鏽鋼外殼電池的理由，同時在一些地方直接標示了引用來源，絕大部分都是來自知乎站內的回答，只有 13、15 兩個來源是站外媒體報道。

圖/雷科技

點擊這些引用鏈接，也確實能夠看到相對應的信息和觀點來源。不過需要注意的是，引用也只是部分引用，比如在「維修友好」的部分，引用來源只提到了前半句的「不鏽鋼電池外殼的設計可能便於維修」。

至於後半句關於「iOS 維修模式」的內容，實際在引用鏈接中只字未提，更多還是大模型的「創作」。

另外，「知乎直答」雖然號稱可以利用站內的海量優質內容，但實際不同問題下可以利用的站內內容質量參差不齊，有些問答本身的質量就比較低，甚至回答幹脆就是由 AI 生成的。

這可能也是知乎選擇將檢索範圍從站內擴大全網的主要原因之一。

但無論如何，「知乎直答」最終都是要「生成回答」的。在這一點上，得益於站內的優質內容，「知乎直答」確實在一些領域中表現得比較專業，回答的內容更加切實，而不是空洞。

以 C919 的問題爲例，「祕塔 AI 搜索」的回答比較離題，結論也很寬泛。

祕塔 AI 搜索的回答，圖/雷科技

同樣的問題在「知乎直答」這邊則有更高質量的回答，相關的信息和觀點都稱得上言之有物，能夠幫助用戶更好地理解 C919 的定位、競爭力以及意義。

知乎直答的回答，圖/雷科技

此外在「五年前大家對 5G 都是什么看法」的問題中，「知乎直答」在开頭就回答道，「五年前，即 2019 年，人們對 5G 的看法是多元化的，既充滿了期待也伴隨着一些質疑。」之後展开的觀點，也確實反映了當時中文互聯網上對於 5G 的不同觀點。

圖/雷科技

不過一些問題上，小雷也發現了「知乎直答」的一些不足。

比如詢問「姚明加入 NBA 的時候，NBA 亞軍隊的教練是誰」，可以看到「知乎直答」知道了姚明加入 NBA 是在 2002 年，但表示「沒有直接信息表明姚明加入 NBA 那一年的亞軍隊教練是誰」。

但如果繼續追問「所以 2002 年 NBA 亞軍隊的教練是誰」，「知乎直答」可以給出正確的推導過程和答案——新澤西網隊（現布魯克林籃網隊）時任主教練拜倫·斯科特（Byron Scott）。

圖/雷科技

換言之，「知乎直答」完全是有能力直接給出正確答案的，但不知道受限於什么因素，需要用戶繼續追問才能給出最終回答。

還有在不鏽鋼電池外殼問題的追問中，隨着追問輪次的增加也會影響「知乎直答」的上下文理解能力，比如在第五輪的追問，直接詢問「換用不鏽鋼外殼會有哪些變化」，AI 似乎忘掉了之前都是以手機電池爲核心。

圖/雷科技

而在第六輪的追問中，小雷重新提到了「手機電池」，AI 倒是也能重回正軌，基於手機電池進行回答。

簡單來說，「知乎直答」在剛开始能夠較輕松地結合上下文理解新的問題，但隨着上下文長度的拉長，這種理解能力可能會有明顯地下降。

寫在最後

總的來說，在一衆 AI 大模型產品之中，「知乎直答」確實找到了一些差異化的定位，基於站內的優質內容，提供更高信息量、更能追溯來源的回答。

不過問題也還存在，有些可以通過一些技巧解決，比如最好明確時間而非使用「X 年前」作爲輸入詞，多輪問答可以適當強調下關鍵詞等；有些還是需要基礎大模型以及技術上改進，比如模型對用戶意圖更深層的理解，參考來源的權重排序或者篩選等。

就現在來說，如果我知道一些領域和話題已經在知乎有了精彩的討論，確實會更愿意使用「知乎直答」快速、便捷地進行了解和深入。

但會不會更大程度地使用「知乎直答」作爲日常獲取信息和觀點的渠道呢？還是要看後續模型和產品的改進，我相信還是很有希望的，就像知乎直答官方號在一個關於「知乎直答」的問題中答到：