供需錯位的大模型丨企服战事

2023-09-20 18:40:04    編輯: robot
導讀 大模型的價值釋放有多大想象力,大模型賽道的玩家對落地就有多焦慮。 徵途是星辰大海,投入是無底洞窟,如果落地的產出缺了或是慢了,風口過後的可持續發展和迭代都是空談。  細數一下比較成功的落地案例:前有...

大模型的價值釋放有多大想象力,大模型賽道的玩家對落地就有多焦慮。

徵途是星辰大海,投入是無底洞窟,如果落地的產出缺了或是慢了,風口過後的可持續發展和迭代都是空談。 

細數一下比較成功的落地案例:前有妙鴨相機靠9.9一組寫真點燃朋友圈,可寫真這個需求太小、不太可持續;後有360半年報披露其大模型業務創收2000萬元,盡管與15.6億元的研發投入相比只是滄海一粟,但好歹見到了現金流,算得上是一個積極信號。

一個清晰的事實是,目前大模型的落地途徑比較單一,比較可靠的商業模式只有to B方向的大模型部署以及模型使用、訓練的算力需求兩種,其價值釋放的緩慢可想而知。

即使是這兩種花了大半年時間摸清楚的邏輯,在智能化這樣的买方市場中,還有不少需要技術服務商突破的隔閡,例如怎么打开中小企業市場、減少定制化導致的高人力成本等。

進一步說,各行各業迫切需要看到可靠的落地案例與方向,打消他們的顧慮,一起掏錢幫助大模型賽道的玩家們走上可持續的正軌。

我們對話了多家行業企業,試圖管中窺豹,爲大模型的價值釋放“摸底”。我們了解到的情況是,服務商“鞭長莫及”的中小企業市場中,相當一部分以調用开源模型來先喫螃蟹的企業已經收獲了不小的效率躍升。而目前服務商們一致發力的,以制造業爲主的KA市場卻對大模型相當不感冒。

這對國內大模型玩家而言不算是個好消息。

最大挑战:幻覺

美國社會學家Marc Prensky曾於2001年提出“數字原住民”的概念,泛指在21世紀的數字時代中成長起來的年輕人。而在大模型的衝擊下,2023年進入社會的年輕人或許將成爲首批“AI原住民”。

就像7月初入職某家SaaS企業銷售崗的小張,因如今互聯網語境中充斥着的“萬辭王”、“不打800個電話不能走”等段子而忐忑不安時,大模型幫助他在人生第一份工作中穩定下來。

小張入職第一天,他預想中“一位老銷售帶人熟悉業務”的流程並未出現,而是領導簡單介紹了一下工作強度、時間安排等情況後,就扔給他一個網址和一個文檔,讓他“看文檔熟悉業務,有不懂的在網址裏提問”。

小張的第一份工作就這么开始了。據他所說,除了入職的頭兩天去了公司坐班,往後將近兩個月時間都在外跑業務,只有團隊开會的時候會回公司述職。而工作中遇到的疑問如HR SaaS的客戶案例、銷售話術、市場價格比對等,他都可以在網址中提問從而獲取答案。

“我找陽哥(領導)的次數估計連我提問次數的一半都不到”,小張說,所謂網址便是大模型的交互頁面,該公司將大模型能力應用在了新人銷售的培訓和業務展开上。

據了解,該公司採用的第三方AI服務商的產品,模型能力來源於ChatGPT。他們將此前已成文檔的市場價格走向、公司業務流程、常見客戶QA等信息交由大模型整合爲數據集,並提供快速檢索能力。據公司領導林陽介紹,大模型目前已經做到爲新人銷售培訓平均節約5天時間,這還是在尚未計入老銷售的時間成本的前提下。

此外,大模型還進入他們多個崗位的工作流,如研發部門的初級代碼編寫、人力部門的JD編寫以及運營部門的客戶報告等。

只是林陽還告訴光子星球,大模型能力只在銷售環節“效果拔群”,其余部門在使用上卻不盡如人意,主要起輔助作用。比如代碼生成大多局限於前端,而且生成內容必須經由人工校對。

人工校對必要性的背後是大模型難以避免的幻覺現象,簡單來說就是“一本正經地胡說八道”。其成因在於訓練數據存在偏差以及訓練方法NTP(預測文本)等。一個典型的例子是,我們讓某多模態模型生成一張“松鼠鱖魚”的圖片,生成結果與這道徽菜實際的樣子八竿子打不着。

顯而易見,幻覺是大模型落地嚴肅商業場景的最大挑战之一,尤其是工業、金融等對精確度要求極致的場景。事實上,早在大模型之前,工業機器人與智能投研等AI應用就試圖在工業、金融領域找到战場。在部分業內人士看來,這些嘗試都免不了“形而上學”的意味。

老陳是南方頭部流體控制企業的高級工程師,浸淫流體控制設備十數年,甚至曾帶領團隊參與核級流體控制設備的生產。作爲典型的工廠老人,他對AI在工業流程中的應用嗤之以鼻。

“工業生產第一要的是穩定安全,只要‘幻覺’問題存在,對穩定安全就是一種威脅”,老陳說,“我看到的所謂工業機器人,宣傳了也有小十年的,到現在還只能做一些焊接、碼垛之類的簡單活兒。”

老陳所言雖有些過激,卻不無道理,畢竟連創造GPT的OpenAI早在2021年便放棄了機器人業務。至於近來全球頂級公司开始關注的人形機器人賽道才剛剛开始,更別提應用了。

老陳所見所思的工業數智化,更多在於避免工人的重復勞動以提高效率。例如與供應鏈上下遊共同採买的雲端系統,讓產業鏈的各環節可以實時上傳生產進度、器胚良品率等數據,協調生產節奏與訂單交付時間,避免返工的情況。

老陳還向我們分享了一件趣事,曾經他們公司接觸過一家主要提供CV領域產品檢驗服務的第三方AI服務提供商,他也受邀參加了服務體驗。“他們的模型需要大概20秒來判斷一個設備是否達到出廠需求,我們高級技工只需要目檢8秒,那我還不如花錢多僱點技工呢。”

更進一步說,大模型應用嚴肅場景,需要突破的關鍵一點還在於成本問題。 

舉個例子,工業生產中最常見的儀器之一是讀取環境溫度、溼度等參數的傳感器,一旦傳感器讀數高於或低於某一閾值,便需要機器執行不同指令,如減緩來料速度、加入冷卻液等。這不需要應用成本高昂的模型,只需要在傳感器所涉及的小系統內設置一個既定的“規則”即可。

結合工業場景需求,我們不難理解工業界相對模型會更偏向於規則的做法。但不可否認的是,許多制造業公司早在大模型前便已引入機器學習模型迭代業務,尤其是在一些數據量巨大、人工設計規則難以窮舉的場景。

這或許也是工業方向大模型服務的發力點所在。而大模型目前展現的簡單內容生成能力與高昂的部署成本完全是對工業場景的一種錯配。

“多快好省,越簡單越好”是老陳視角下,工業界對新興技術應用的需求。目前看來,大模型似乎與之並不沾邊,更多的應用會集中在非業務核心板塊上。

數據之海中掘金

AGI是終極命題,我們對大模型的期待自然不能止步於幻覺。以大模型爲代表的AI能力也並非無法在所有嚴肅場景應用,而是需要准確認知大模型的能力邊界所在。

細想一下,上文提到的案例企業之所以會認爲大模型的價值有限,主要是因爲幻覺問題導致生成內容的不可解釋、不可追溯。那么,我們能否跳出爲ChatGPT所錨定的AIGC範式,以其他方式推動大模型釋放價值呢?

只需簡單轉變思路,我們即使在以嚴謹著稱的金融行業,也能尋到了大模型釋放正向價值的案例。

據ESG數據服務商秩鼎CTO王彬介紹,秩鼎的大模型在調用商業模型API的情況下,極大提高了其數據處理相關業務的效率,而其中最大的突破在於做到了傳統金融體系之外的數據映射。

通常,傳統金融體系中的數據映射基本圍繞上市公司股票代碼做映射即可,而ESG領域中存在大量“另類數據”,如專利、行政處罰、新聞報道等,這些數據要素所關聯的主體的稱呼、層級各異,存在職員、工作室、部門、子公司等不同維度的數據信息,映射難度非常大,“就像就上百萬家公司一個一個做天眼查的查詢”。

而大模型的加入,讓秩鼎可以對同一上市公司主體延伸的子公司、業務、股權與工商信息等數據進行識別與提取,最終做到映射的效果。這項成果目前已在中信、華夏、易方達等頭部公募與銀行、保險等金融細分行業中落地,客戶反饋良好。

目前,秩鼎已將大模型能力嵌入其數據處理的多個環節,大模型既可以作爲特定數據的“搜索引擎”,也可以作爲文本分析的智能助手,如將微博、網頁新聞等輿情監測系統抓取的海量低質量數據做進一步提取;或是解析招股書、財報等復雜文本,以數據標准化的方式初步分析某一上司公司相關新聞的新聞情緒等。

作爲嘗到大模型甜頭的少數企業之一,秩鼎對大模型價值釋放的前景卻格外審慎。王彬將to B應用簡單分爲三層,從低到高分別是數據層、工具層與決策層。在他看來,而大模型的價值釋放主要集中在數據層,工具層的應用“基本上幫不上忙”,至於決策層則是大模型“可望不可即”的領域。

“打個比方,海量數據其實就是一個大金礦,工具是自然用以探金、掘金,大模型目前完全可以勝任前期的探索工作。可一旦深入數據的應用,就會卡在確定性、可靠性之前,更高層的決策就別提了”,王彬說。

限於金融視域,王彬對大模型的應用場景可能略有局限,但我們仔細梳理當下大模型應用,不難發現其以數據爲核心來釋放價值的底層邏輯。

例如上文所提到的企服企業,其嵌入大模型的代碼編寫、客戶報告、培訓資料等工作流環節雖是以內容生成的方式呈現,但本質上也不過是對粗放數據的初步處理,在一定程度上保障精確性的同時極大壓縮了信息密度,以提高職員的工作效率。

即使是最簡單的銷售話術,銷售小張也需要在大模型生成答案之後再經過自己的一些加工美化方能發給客戶。這其實進一步佐證了大模型在工作流中的地位——局限於初步處理環節,而且大多無法脫離人的把關。

更進一步說,把關的必要性來自於模型無法根除的幻覺問題,那么在業務落地上,這一問題能否在未來尋到解法?

這個問題的答案可以自大模型風起前的深度學習方案中窺得一二。

實際上,早在大模型之前的機器學習就已經遭遇了“幻覺”的前身——過擬合。即機器學習過程中會發生的“強行”總結共性和規律的情況。好比我國歷史上家喻戶曉的司馬遷、蔡倫與鄭和,他們的共同身份是太監,而機器很可能會由此得出“太監是成功的必要條件”這樣令人哭笑不得的結論。

這是由機器學習的方法所決定的,就像大模型的幻覺來源於Transformer框架,這意味着類似問題基本上沒有一勞永逸的解法。

如果說各行各業積累的大量數據是金礦,那么大模型就是我們試圖挖掘數據價值的探頭,它能幫助我們找到金礦中的金子,甚至進行初步的攫取,但要用來挖礦甚至判斷什么是金礦,那還是差了些意思。

釋放價值的正確姿勢

大模型釋放價值是一個比較大的命題,但我們將他拆解一下,實際上也就是大模型用來做什么,以及該怎么用。而大模型服務商們似乎過於追求參數、能力等硬核指標,反而在解決實際問題上顯得有些“畏首畏尾”,比較典型的是至今尚處於場景探索階段的金融大模型。

顯然,服務商們對大模型進入千行百業的暢想難免給人一種“好高騖遠”的印象。畢竟智能化的供需雙方很多時候根本處在兩套話語體系,互聯網外的行業採購代表很多都不知道大模型是什么,如果再不“約束”一下大模型的能力邊界,反而容易適得其反,進入各說各話的怪圈。

那么大模型的價值釋放會給我們什么感覺?

十數年前,上班打卡要么在小本本上親筆籤名,好點的則是伸出大拇指按一下指紋打卡機。當下,我們上班打卡只需要在靠近公司的時候掏出手機。這一前一後的變化,在於以在线OA爲基礎的協同辦公應用的出現。作爲企業級應用,協同辦公讓“打卡”這一環節愈發簡單、省時,讓使用者足以養成使用習慣。

更進一步,習慣的養成會模糊我們對事物的感覺,下意識認爲“本應如此”,類似的場景還有站街邊揮手招車與當下在電梯裏便會打开的網約車。這種“無感沉浸”的感覺既是消費市場的追求,也是企業市場的需求。大模型如果希望能在千行百業釋放價值,“無感”同樣是重要指標。

"大模型被我們集成進數據中台了,相比以往,除了數據處理的效率提升外,幾乎沒什么感覺,也沒有對工作流程有什么其他的明顯影響",王彬說。

在他看來,即使大模型成本再高、技術創新再多,只要大模型不是類似“聖杯”定位的萬金油方案,那么其價值釋放也只限於工作流中的某個或某些環節。 

更值一提的是,王彬還特別強調了現階段的大模型應用還需其他技術做輔助,例如PDF識別這項數據處理業務。如果簡單將PDF丟給大模型的話,文字識別與文字整理將耗費大量算力與時間。而我們僅需在將PDF丟給大模型處理前,用低成本的OCR方案給出文字,那么大模型的處理效率將會成倍提升,成本降低自不必說。 

工作流這一概念誕生於上世紀IT爆發所帶動的辦公自動化風潮,如果我們將IT概念從中抽離,工作流所包含的人與機器交互、標准化、高效率等邏輯實際上與福特發明的“流水线”有異曲同工之處。大模型好比是流水线中的高精刻刀,在該環節能帶來效率的顯著提升,但並非放之四海而皆准,而且需要精確的使用方法。 

只不過,王彬與其團隊對大模型的應用建立在其對深度學習和數據中台的認知基礎之上,作爲應用經驗,難以“推己及人”至更廣泛的非IT企業,我們不能要求每一個希望獲得大模型能力的企業都得自備一個帶有AI背景的工程師團隊。 

因此在明確應用邊界與方向後,大模型進一步要做的是向協同辦公靠攏,提供低成本可復制的解決方案。而行業當下普遍展开的定制化合作與之背道而馳,這會讓客戶群體局限於資源更多的大客戶。依靠工程師力大飛磚跑出來的個案即使宣傳再多,也入不了中小企業的法眼。 

山不來就我,我便去就山。大模型扎根行業需要的是用標准化、低成本的封裝,代替高度定制化的成本敘事,此外,還需要服務商將注意力從“煉丹”之上挪开少許,拿出做SaaS的精神。在一個买方市場中堅持用戶本位的思想,再正常不過了。 

       原文標題 : 供需錯位的大模型丨企服战事



標題:供需錯位的大模型丨企服战事

地址:https://www.utechfun.com/post/265283.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡