模型競爭持續了半年,京東雖然遲到卻未缺席。
7月13日上午,京東在2023京東全球科技探索者大會暨京東雲峰會上,正式發布京東言犀大模型,同時發布言犀AI开發計算平台。該平台已經啓動預約注冊,預計8月正式上线。
京東集團技術委員會主席曹鵬表示,京東靈犀大模型源於產業、服務產業,具有更高的產業屬性。
國內頭部雲廠商中,於大模型領域先行佔位者如百度、阿裏已經在模型能力上卷過一輪,爲避免產品服務同質化,京東將定位放在“產業”與“專精”以求差異性。
作爲模型競爭的另類參與者,京東不會做大包大攬的“大生態”,而是更強調落地應用與產業場景,承接京東雲以往的定位“更懂產業的雲”。
產業大模型,是京東爲自己“量身定做”的服務模式,避开通用能力的橫向比較,聚焦於專項領域的模型處理能力。
數據“專項專練”
大模型競爭走入深水區,數據的重要性越來越突出。
數據規模與質量都會影響模型最終呈現效果,故而當下企業和研究機構都在積極投資於數據收集、數據清洗和數據標注,以獲取更好的數據集來訓練其大型模型,作爲競爭優勢。
數據集足夠優質且有代表性,就能訓練出更專精的產業大模型。
許多公司在試用 ChatGPT 和其他大模型時,會發現它們用清晰語言表達復雜想法的能力非常出色,但無法響應有關專有內容或知識的提示或問題。因爲訓練大模型的數據普遍來自互聯網公开資料,缺乏對特定領域的深入挖掘。
相比之下,產業大模型的訓練數據更加專注於特定領域。這些更准確、一致和具有產業代表性的標注信息,能讓大模型學習到適配相應領域的語言規律,同時減少模型學習到錯誤模式的風險,提高模型的精度和可靠性。
探索者大會上,京東強調,作爲一家新型實體企業,自身發展就來自產業場景歷練,擁有包括零售、物流、科技、健康、工業、產發等豐富的產業布局。
這爲京東積累下每年數百億條優質交互數據,訓練言犀大模型的數據庫,就由70%通用數據和30%供應鏈原生數據組成。
用自家數據訓練自家模型,京東的優勢就是京東言犀大模型的優勢,這是京東想展現給外界的邏輯。
有知情人士提到,京東所有事業部都在配合模型訓練,並提出自己的需求,其中京東零售幾乎交出了所有數據。
京東在電商領域經營多年,且一直保持的頭部的體量與影響力,其完整的商品產銷與售後數據,都是訓練大模型最好的“養料”。京東可以借用大模型研發搭售商品,輔助商家完成營銷物料准備,或者制定組合策略。
京東介紹,在電商領域,京東大模型在AIGC與內容營銷的配合上獨具優勢。從一張商品圖出發,它能夠理解商品特徵,快速生成電商運營需要的商品主圖、營銷海報圖和商詳圖等,滿足商家快速开店和營銷的需求。人工智能可以讓每套圖的制作成本能降低90%,制作周期也從7天縮短到半天。
這些生成質量、效率上的表現,都來源於數據“專項專練”。通俗來講,就是做電商的最懂電商,京東大模型能爲在電商領域有生產力需求的客戶,提供最具針對性的服務。
但略顯尷尬的是,目前京東所描述的,AIGC在零售領域的應用僅限於文生文、文生圖,跨模態和多模態能力相對來說並不成熟。
技術迭代到現在,多模態處理能力幾乎是頭部大模型產品的標配,京東坐擁足量優質數據,在技術呈現上,卻還顯得相對原始。
產業大模型,一種“量體裁衣”
各家都在追求以模型通用能力爲基礎,進而服務千行百業之時,單獨強調產業場景的特殊針對性,難免會讓人覺得有“避重就輕”之嫌。
產業大模型需要兼顧通用能力,這是提供模型服務的前提。
以最近大熱的BloombergGPT(彭博GPT)爲例,同樣是聚焦與特定領域、具體場景,在官方發布的論文中,對BloombergGPT的評估包含了兩部分,金融領域評估與通用領域評估。
BloombergGPT基於Bloomberg終端(Bloomberg Terminal)的海量金融數據進行訓練,數據涵蓋了各種金融文檔,如新聞、報告、評論、財務報表等。與京東數據“專項專練”的產業大模型訓練思路頗爲一致。
文章指出,在金融領域任務上,BloombergGPT綜合表現最好,同時在通用任務上,BloombergGPT的綜合得分同樣優於相同參數量級的其他模型,甚至在某些任務上的得分要高於參數量更大的模型。即BloombergGPT在金融領域表現突出的同時,並沒有以犧牲模型通用能力爲代價。
更直白的說,如果一個大模型缺乏通用能力,可能會限制模型應用範圍的靈活性。通用大模型通常能夠處理各種類型的語言任務,並從廣泛的語料庫中學習到多樣性的語言模式。作爲對比,專業大模型的泛化能力可能受到限制,無法適應多樣的應用場景和任務。
所以大多數廠商會選擇在通用大模型的基礎之上,進行特定領域的訓練和優化开發產業大模型,使其具備更深入的行業知識和理解,提供更准確的內容生成。同時廠商也會重點指出訓練模型時,會兼顧通用與專業。
而反觀京東對言犀大模型差異化定位的描述,並未強調其通用模型能力,着重強調對特定場景、特定行業問題的解決力。
京東表示,不會向千行百業提供通用大模型,通用性不是目的,原生數據集所帶來的能力,對零售、健康、物流、金融這幾個特定行業的深入理解,構成了言犀大模型的差異。
大模型華山論劍,當各家大廠都在以技術能力展示其功底如何深厚之時,京東卻話鋒一轉,說自己身經百战,對手衆多皆是一流、京東大模型實力必然也是個中翹楚。
這種“泥腿子”路數似乎對應着京東一直以來的“江湖味”作風,沒有絕對實力和話語權,又不得缺席競爭,就以江湖經驗標榜自己不落人後。
如此看來,不做通用,反復重申自己“產業大模型”的定位,其實是一種更適合其當下發展路线的“量體裁衣”:長處不在技術之時,宣傳場景更有優勢。
只是這個定位也非京東獨家。
百度、阿裏這類在通用大模型之路上狂奔多時的企業,正不斷推出行業應用、產業結合方案。同樣入局稍晚的騰訊、華爲也在近期發布了自己的行業大模型。具體場景、特殊領域的模型能力的確更符合應用邏輯,也更容易跑通商業模式。
無論定位如何,宣傳側重怎樣,客戶的選用最終還是要看真實產品表現。雖然打出了產業的旗號,京東目前的宣傳賣點還在側重於智能客服和智能導購這些相對初級的應用場景,恐怕離“產業”還有相當一段距離。
先革自己的命
從整體战略布局來看,京東大模型的推進思路也略有不同。
據官方解釋,言犀大模型的落地分3步走:第一步,基於內部實踐構建通用大模型;第二步,在零售、金融、健康、物流等京東內部高復雜場景大規模錘煉,融合行業解決方案對外輸出;第三步,針對嚴肅商業場景將大模型能力對外开放。
模型訓練非常依賴實時數據反饋,故而多數廠商會選擇盡快公开投入測試,以求在實用中收集真實數據,對模型進行調整。
按照京東的提法,开發大模型對外服務是下一個階段的目標,當下先得着力滿足自身業務需求才行。
對此,京東內部技術人員的解釋是,因爲京東目前還沒有完全完成模型對內部場景的接入。
雖然京東集團各大事業部都在支持模型訓練,希望盡快接入,但不同業務對模型的需求差異較大,滿足所有內部場景需求在現階段對京東來說壓力不小。
“比如零售業務需要模型做推薦和風控、研發團隊希望模型幫助提升編碼效率,都得做針對性調整。我們會逐步开放一些在內部場景磨煉成熟了的能力,今年下半年還是重點在內部的打磨。”
可以把這種先拿自家業務體系做實驗,再對外售賣成熟服務的思路視爲一種推己及人。京東旗下業務涵蓋面廣,“先革自己的命”做出一個大模型應用的範本,也是對自身產品能力的最好證明。
只不過就目前釋放出的消息來看,由內及外更像是產品還未打磨完整,出於控制風險和成本的考慮,把測試範圍先限制在內部,以保證家醜不外揚。
如前文提到,京東不對外开放其通用大模型,而當下內部多場景的協調不順,似乎已經在暗示一些通用性的不足,拖慢了產品推進的腳步。
原文標題 : 言犀大模型,雲計算競爭中的“泥腿子”
標題:言犀大模型,雲計算競爭中的“泥腿子”
地址:https://www.utechfun.com/post/238160.html