國產大模型發布,我們都涉身其中了

2023-09-06 18:40:06    編輯: robot
導讀 百度文心一言、訊飛星火,國產的大模型陸續开放給普通用戶了,這也是人工智能AI的新階段產品、預訓練語言大模型(LLM)產品在國內的首批產品。文心一言、訊飛星火上线後,很快都登上了國內蘋果和安卓應用商店...

百度文心一言、訊飛星火,國產的大模型陸續开放給普通用戶了,這也是人工智能AI的新階段產品、預訓練語言大模型(LLM)產品在國內的首批產品。文心一言、訊飛星火上线後,很快都登上了國內蘋果和安卓應用商店的免費應用排行版前列。

從去年11月30日OpenAI公司推出ChatGPT的9個月後,中國版產品也跟上了,國內民衆終於可以合法、穩定地體驗、使用新科技。 

01大模型之前AI什么?

在人工智能之前的歷史上,有過5大相對成熟的應用:機器翻譯、搜索引擎、圖像識別、語音識別和智能客服。

其中圖像識別和語音識別領域滋養了最多的有規模的創業公司,有非常可觀的投資和收入規模,著名的公司包括商湯、曠視,科大訊飛、雲知聲等等。

智能客服在銀行、通信運營商和IT、互聯網等面向大規模用戶的企業中應用廣泛,以前採用專家系統,一種半智能的問答系統。後來全面轉到自然語言等技術後,AI和自動化水平明顯提高,普通民衆對此感受深刻,同時也有了很多面對機器人的無奈。著名產品有騰訊企業、環信、網易七魚等。

機器翻譯最早的版本是2006年由谷歌公司推出,10年後的2016年推出了深度學習版的翻譯引擎,翻譯效果明顯提高,達到民用基本無誤的水平。谷歌、必應和國內的有道、百度翻譯是這個過程裏的主要角色。

搜索引擎就更加廣爲人知了,谷歌的搜索引擎一下把互聯網的信息檢索從雅虎代表的目錄管理水平,(可以想見目錄管理源自傳統的圖書信息管理,是圖書時代向互聯網時代進化中的過渡方式。)提高到了面對海量數據使用關鍵詞搜索的水平。搜索引擎滋養了美中兩大互聯網巨型公司:谷歌和百度。

而語言大模型產品,不但囊括了上述應用,還誕生了自己新的功能:AIGC,就是人工智能自動生產內容,無論是文字、繪畫、音樂還是計算機代碼,人工智能產出的內容達到了讓人驚豔和震撼的地步。

這一切,是計算機面對人類誕生以來的所有知識和信息的這個層面上,處理和消化了其中20%多的內容後,訓練出的能力,代表了人類至今對數據的處理能力、軟件工程能力,以及配套所需的巨量計算能力的最高水平,已經接近達到顛覆人類自己智力的階層。 

02人們之前怎么使用AI?

按照上述梳理,此前我們在使用AI的時候,像圖像和語音識別、智能客服,大部分是場景相對固定的商業、專業應用,用戶基本上是被動的。咱們來說說服務大衆用戶的機器翻譯和搜索引擎。

自動翻譯是有人類以來對AI夢想的起點。機器翻譯從上线那一天开始,對普通用戶就是免費的,但是免費中有很多層意思。

免費首先意味着它是網站的純投入無收入的成本部門,沒有現金收入,對機器翻譯的考核加了一項重要指標就是流量,作爲網站整體服務的重要一環,留住用戶。谷歌瀏覽器Chrome有一個功能,就是用谷歌翻譯把整個頁面內容自動翻譯成用戶所需的語種,對跨語種在網上衝浪的用戶非常友好。

機器翻譯之所以免費,還因爲它無論號稱多么准確,總會出現對某個單詞的錯別解釋,整句整段的語義不連貫和錯誤地方就更多了,以及無法糾正的機器腔——它的遣詞造句對用戶閱讀來說很別扭,類似星球大战裏機器人C-3PO——說話走路都帶着機器的味道。這種層次的產品讓用戶付費的話,我估計無論是工程師和網站的銷售都沒有這個底氣,於是機器翻譯生而免費。

最初,產品經理和工程師還有一項期待:希望通過獲取用戶對翻譯結果的反饋來提高機器翻譯質量。這一項指標寫在每一任機器翻譯的產品經理的項目報告裏。但是快20年了,反饋還是不足以讓工程師來訓練更好的翻譯引擎。因爲機器翻譯和用戶的交互非常弱,幾乎沒有人愿意花時間把自己對譯文的看法、尤其是對某個詞句的具體意見寫下來提交給運營方。

所以機器翻譯雖然在AI一度廣泛使用的自然語言處理技術NLP中,被稱作技術應用的皇冠,在計算機技術專業領域存在感是A級;在用戶端受到關注但是好評度並不高、存在感降到C級;在商業和投資價值方面,它是最末流的D-級。因此它就是大型互聯網企業養育的一頭銷金獸。

搜索引擎是另外一番天地,它滿足了人們上網的第一需求:獲取信息。是搜索引擎第一次真實實現了互聯網上的信息自由。同時產品經理還創造了搜索引擎嵌入廣告和關鍵詞排名廣告方式,徹底改變傳統世界商業信息傳播介質,互聯網取代了傳統廣播電視報紙雜志和戶外等媒體,成爲獨大的廣告平台,谷歌也成爲有史以來廣告收入最多的公司。

搜索引擎中的人工智能,主要體現在兩點:一是盡可能對用戶輸入的搜索關鍵詞的理解正確,以便展示出最合適的內容;第二是對內容庫裏的內容進行管理,以匹配用戶的需求。

谷歌之所以拿到了有史以來最大的廣告收入,是因爲它匯集了有史以來最大的用戶群,擁有最多的用戶畫像和最全的資訊數據庫,在幫助建立所有人對所有信息的鏈接的同時,也建立了商業买賣的橋梁,搭建了廣告銷售的機會。

03我們怎么使用大模型?

囉囉嗦嗦說AI的歷史,是要來告訴讀者,現在使用大模型會是一個什么樣的場景?

大模型的基礎版是免費的。這個免費也同樣有很多層意思。

首先當然是因爲所有AI的缺點,它不保證每次提供給你的信息是准確和正確的,它會告訴你“我的回答有90%的概率是對的”,但是哪裏不對,什么時候會出錯,AI不知道,工程師們也不知道。

但是大模型之所以說橫空出世,是它在類似於無所不知的搜索引擎的基礎上,把它之前訓練模型時所包括進去的信息,用一個有條理的文檔來回答你。你可以理解爲以前的搜索引擎升級到了智能搜索1.0版,區別是以前用戶需要在搜索結果中逐頁打开找到自己的目標信息。而大模型不但幫你找到,還幫你總結稱流利通順的文字了。

還有更進一步的功能,大模型會幫你按要求寫作、畫畫、編曲,甚至寫計算機代碼,幫助你寫作業,做科學研究。目前我們但凡涉及到語言(聲音、文字、繪畫、音階、計算機代碼)的腦力工作,大模型都可以部分甚至完全替代。

以前人們普遍看不上藍領的技能&體力工作,沒想到大模型AI上來就要替代大部分的白領工作。 

理論上,人們除了睡覺喫飯出門運動,其他時間可以全身心撲在大模型上完成自己的學習、工作。目前,這些都是免費的。

運營公司因此建立龐大的用戶群,最好只來我家不去其他家。因此頁面上大概率會和其他互聯網公司一樣,會出現廣告。同時,即使這邊免費,大模型還備着很多收費的產品要賣給他們呢。對,大模型將是第一次對大數量級的普通用戶收取費用的平台級產品,因爲它要從人類整體積累的知識與能力的層次上,給你學習和職業的支持。

龐大用戶群的另一個價值,就是利用機器和人的交互對話,大模型能夠迅速提高自己的智力水平。而對個人用戶來說,也是你在訓練符合你的興趣和需求的個性化大模型的過程。所以,大模型類似於每個人的外腦一樣,越用越離不开。這種終生服務,就是大模型公司正在計劃和實施的事情。

如何讓提高大模型的確定性,提高它服務的正確與准確度,除了和用戶交互之外,大模型一定邀請了更多小型垂直的應用服務商來一起开發,比如一個數學學習和研究的應用,比如一個腦外科手術的應用。類似於大模型提供通用的判斷和技能,而具體應用把具體服務落地。

以上是目前第一代大模型和用戶相處的場景。

從技術和產品來說,科學家們相信和人類智能相當、甚至超越人類的AI一定會出現。其中涉及的道德倫理不是本文要討論的,僅就使用而言,一切都剛剛开始,機器在瘋狂地進步,我們也要盡力跟上。

圖片來源於網絡,侵權請聯系刪除。

       原文標題 : 國產大模型發布,我們都涉身其中了



標題:國產大模型發布,我們都涉身其中了

地址:https://www.utechfun.com/post/258445.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡