解題准確率較GPT高出70% 誇克大模型多項考試評測成績領先行業

2023-11-23 18:23:08    編輯: robot
導讀 “大模型時代,誇克有巨大機會創造出革新性搜索產品。”11月22日,誇克大模型公布了其面向搜索、生產力工具和資產管理助手的大模型技術布局。數據顯示,誇克千億級參數大模型登頂C-Eval和CMMLU兩大...

“大模型時代,誇克有巨大機會創造出革新性搜索產品。”11月22日,誇克大模型公布了其面向搜索、生產力工具和資產管理助手的大模型技術布局。數據顯示,誇克千億級參數大模型登頂C-Eval和CMMLU兩大權威榜單,誇克百億級參數大模型同樣在法律、醫療、問答等領域的性能評測中奪冠。


憑借在搜索業務和智能技術上的長期積累,誇克大模型利用數據、平台、知識增強等優勢,可以大幅提升知識正確性。在醫療健康領域,誇克大模型已經可以將問答內容的幻覺率降低至5%,處在行業領先水平。

1 誇克推進搜索革新,自研大模型打造技術新底座

在互聯網高速發展的30余年中,搜索曾經高效地滿足了用戶主動獲取信息的需求。但是隨着移動互聯網內容生產和供給模式的轉變,傳統搜索逐步變得封閉化、孤島化。基於大模型的AIGC技術將會給搜索產品帶來全新變化,推進搜索革新已經成爲行業共識。

誇克技術負責人蔣冠軍表示,誇克大模型是面向搜索、生產力工具和資產管理助手的應用型大模型。在搜索應用中,將通過圖文多模理解、專業知識生成、交互方式創新進一步拓寬應用場景,提升用戶體驗。

(誇克技術負責人蔣冠軍)

誇克大模型的優勢源自於智能技術實力與搜索業務基礎,蔣冠軍認爲,誇克大模型有四大優勢:第一、最全面的通用知識數據和行業知識數據,以及知識理解和評估體系;第二、得益於搜索技術體系的積累,擁有千億級參數平台的模型訓練能力;第三、擁有長期智能化產品經驗的智能技術產運團隊。第四、擁有全行業的知識增強技術體系及能力。

面向未來,要解決大模型的應用問題,關鍵要解決知識正確性問題。據悉,基於強大的搜索產品和智能技術積累,誇克大模型在知識增強上的優勢可以大幅提升知識正確性。同時,在醫療健康領域,誇克已經可以將問答內容的幻覺率降低至5%,處在行業領先水平。誇克大模型也將是持續推動誇克App產品體驗創新和邁向新一代搜索的技術底座。

2 誇克大模型性能評測奪冠 四大能力提升用戶效率

日前,阿裏巴巴智能信息事業群發布全棧自研、千億級參數的誇克大模型,將應用於通用搜索、醫療健康、教育學習、職場辦公等衆多場景。誇克大模型的整體水平超越GPT-3.5,在多語言翻譯、寫代碼、安全合規、內容創作等方面處在國內行業頭部水平。

針對AIGC技術與搜索產品在大模型領域的協同發展,清華大學新聞學院教授、博士生導師沈陽認爲,依托搜索平台,誇克大模型擁有高質量的各類數據,在中文語境下,模型能力處在行業領先水平。在教育、醫療等垂直領域中,誇克在對話、解題上的能力取得了新的突破,是國產自研大模型的優秀代表之一。同時,在安全性能上,誇克經歷了搜索場景下的長時間考驗,累積了非常豐富的經驗和能力。

數據顯示,誇克大模型接連登頂C-Eval和CMMLU兩大權威評測榜單,多項性能優於GPT-4。在國內大模型賽道火熱的當下,誇克大模型具備較好的語義理解、知識掌握與應用、邏輯推理能力,整體水平達到行業一流水平。

另外,在最新的百億參數測試集中,誇克同樣在法律、醫療、問答等多個領域中排名第一,誇克大模型在不同參數量級的對比中均表現優秀。

在大模型技術落地層面,誇克大模型的能力體現在四個方面,可以幫助用戶提升工作、學習效率。知識能力,擁有廣泛的知識覆蓋、信息搜集和多語言支持等,支持外接專業知識增強,提升跨領域的知識和語言理解能力;對話能力,具備較強的上下文理解、語境推理、關鍵信息保持和記憶能力,更好地適應不斷變化的語境,理解用戶的意圖和需求,確保對話回復准確、合理、連貫;創作能力,能夠根據主題或關鍵詞,生成連貫、有邏輯、有深度的文本內容,支持續寫、潤色、仿寫、批改等多種不同寫作需求;安全能力,具備較好的世界觀、價值觀,對於明顯的虛假信息,均能做到准確識別、正確回答或者給出合理指引。

以用戶需求出發,打造工作、學習、生活的AI助手,誇克App持續迭代進化。據悉,誇克大模型將全面升級誇克在搜、用、存上的智能化體驗,幫助用戶進一步提升效率。同時,基於多年累積的搜索優勢,誇克將借助AI驅動推進搜索革新,加速邁向下一代搜索。



標題:解題准確率較GPT高出70% 誇克大模型多項考試評測成績領先行業

地址:https://www.utechfun.com/post/294673.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡