开源才是大模型的未來？

2023-12-25 18:40:04 編輯： robot

導讀一年前，ChatGPT橫空出世；7個多月後，Meta宣布开源LLaMA 2，並且可免費商用。這一天，也成爲大模型發展的分水嶺。短時間內，LLaMA 2對一些閉源的大模型廠商造成了致命性的打擊。隨...

一年前，ChatGPT橫空出世；7個多月後，Meta宣布开源LLaMA 2，並且可免費商用。

這一天，也成爲大模型發展的分水嶺。短時間內，LLaMA 2對一些閉源的大模型廠商造成了致命性的打擊。

隨後，全球頭部廠商和創業公司紛紛加入开源浪潮中。目前，國內也有近一半的大模型選擇了开源的方式：

今年7月，智譜AI宣布开源大模型ChatGLM-6B和ChatGLM2-6B，這兩個模型的下載量已經先後超過300萬和120萬。

8月，阿裏宣布开源通義千問70億參數模型Qwen-7B，一個多月下載量破100萬；12月，阿裏持續开源通義千問720億參數模型Qwen-72B、18億參數模型Qwen-1.8B和音頻大模型Qwen-Audio。

9月，百川智能宣布开源Baichuan-7B、13B兩款大模型，其下載量目前已經突破500萬，200多家企業申請部署开源大模型。

11月，元象XVERSE宣布开源650億參數高性能通用大模型XVERSE-65B；

11月底，浪潮信息發布完全开源且可免費商用的源2.0基礎大模型，包含1026億、518億、21億不同參數規模......

僅僅在過去的一個月內，國內最大开源模型的參數紀錄就已經被刷新了N次。性能參數、性價比、可靠性，正成爲搶佔先機的關鍵詞，而开源似乎也成爲大模型發展的主流趨勢。

有業內人士認爲，未來90%的企業會傾向基於开源大模型發展。那么，开源是否真的是大模型的未來？

开源大模型快速趕超

开源大模型的核心理念是开放源代碼，允許公衆訪問、使用、修改和分發模型的源代碼。

面對市場競爭，开源大模型的免費使用是非常有吸引力的獲客手段；同時，低成本的試錯也有助於开源大模型更快觸達潛在用戶群體，降低企業認知和決策難度，加速創新。

從技術角度看，大模型涉及許多技術問題，單靠一家企業很難解決。开源大模型鼓勵全球开發者社區的參與和貢獻，這種集體智慧能夠加速技術的迭代和創新，如GitHub上的衆多AI項目就證明了這一點。

不僅如此，开源代碼使得研究人員和用戶能夠審查模型的工作原理和決策過程，從而提高大模型的透明度和可信賴性。這對於解決AI的公平性、偏見和倫理問題至關重要。

事實上，自從LLaMA 2开源後，業界开始意識到大模型技術沒有任何護欄。

基於成本的考慮，許多企業選擇放棄支付上千萬元的調用閉源大模型API的費用，轉而部署和微調LLaMA 2。

創業者們的目光從解構、增強LLaMA 2轉向了構建行業專有大模型，又掀起了一波LLaMA 2+司法、LLaMA 2+醫療等一系列的行業开源大模型。據不完全統計，LLaMA 2开源後，國內就湧現出了十幾個开源行業大模型。

一份從谷歌內部泄露出來的備忘錄（標題是《我們沒有護城河》）證實了這種觀點：

“我們無法贏得這場軍備競賽，OpenAI 也一樣。當我們爭吵不休的時候，第三個派系（开源）卻在悄悄地喫掉我們的午餐”。

谷歌備忘錄作者發現，自從LLaMA开源後，立刻出現了大量的創新，重大开發成果之間的間隔也在縮短。

Meta是一個明顯的贏家，他們有效地獲得了整個星球的免費勞動力，大多數开源創新都發生在他們的架構之上，沒有什么能阻止他們將其直接整合到他們的產品中。

“當免費、不受限制的替代品在質量上具有可比性時，人們就不會爲受限制的模型付費”，備忘錄裏寫道。

最近，Meta首席AI科學家Yann LeCun轉發了方舟投資（ARK Invest）制作的一張趨勢圖，描繪了开源社區與閉源模型在生成式AI上的發展。

“开源人工智能模型正走在超越專有模型的路上”，他感概道。

有網友甚至表示，我們正在接近一個臨界點。以目前开源社區項目的發展速度，开源大模型將在未來12個月內達到GPT-4的水平。

未來1-2年，开源力量可能在與閉源大模型分庭抗禮。

开源大模型的商業化挑战

盡管开源已成爲現階段大模型發展的一種主流趨勢，开源大模型的發展速度也遠快於封閉生態系統，但並非所有的廠商都選擇开源路线，也並不代表廠商會一直开源所有的大模型。

比如，以开源切入大模型賽道的百川智能，在發布完Baichuan-7B、Baichuan-13B开源大模型後，參數更大的Baichuan-53B大模型則選擇了閉源。

由此可見，开源或閉源並非大模型的唯一發展路徑。在當下，能夠閉源的大模型一定是可以提供足夠高的價值，幫用戶更好地完成高性能的大模型訓練、推理和部署，通過調用API的方式來幫助用戶降低門檻。

這也是OpenAI等AI巨頭閉源的思路，因其自身技術的絕對領先優勢，使得其價值也非常的大。

相比之下，开源大模型除了快速迭代、證明自己的價值，還面臨着更多的挑战，比如：

由於源代碼的公开性，开源大模型可能更容易受到惡意攻擊或濫用，確保數據安全和用戶隱私需要額外的努力和監管。

同時，來自商業模式的不確定性，如何在保持开放的同時實現可持續的商業發展，始終是开源需要解決的重要問題。

回顧歷史，紅帽在开源商業化成功的道路上已做出了示範。作爲最早通過提供企業級 Linux 發行版和相關服務的公司，紅帽通過訂閱模式爲客戶提供技術支持、更新和定制化服務。

紅帽的商業化路徑具體而言：在最上遊的开源社區，參與开源技術貢獻，做大做強生態；提取开源社區中的上遊技術產品，沉澱到自己小开源社區；再將其認爲最有價值的技術檢驗、測試、打包，形成新的產品組合，完成閉源出售給客戶。

同樣將开源成功商業化的公司還有MongoDB, Databricks, Cloudera, GitLab, Docker, MySQL AB......這些案例都表明，开源軟件可以通過提供增值服務、技術支持、企業級特性、雲服務等方式實現商業化，同時保持與开源社區的互動和合作。

盡管珠玉在前，但並不代表开源大模型商業化是一件容易的事。

在如此多的开源大模型競爭壓力下，如何提高自身大模型在用戶中的知名度和接受度，讓用戶從免費使用轉向付費服務，同時還要防止競爭對手可能基於相同的代碼庫創建自己的產品或服務，都考驗着开源大模型廠商的能力和速度。

开源與閉源大模型的協同演化

實際上，开源大模型和閉源大模型各有優劣，且在不同的應用場景和需求下各有其適用性，兩者並非絕對的對立面，而是可以在某些方面相互借鑑和融合。

开源是爲了保持社區的繁榮和多樣性，能夠保證技術、產品能夠源源不斷補充新鮮的血液和產生新的變化。

閉源的商業化版本是用來滿足商業化的需求，即安全、低成本、高效、持續有價值的服務。對比商業版本，开源版本一定是滯後的，包括技術的迭代、維護等等。

因此，兩者的優勢並不在同一個位置，也很難斷言哪一個模式將完全主導大模型的未來。相反，可以預見的是，开源和閉源大模型將在以下幾個方面實現協同演化：

一是，共享與競爭並存。

开源大模型和閉源大模型將在某些領域展开激烈的競爭，如自然語言處理、計算機視覺等。同時，它們也可能在其他領域共享成果和技術，推動整個AI行業的進步。

二是，混合模式的出現。

爲了兼顧創新速度、透明度、安全性和商業利益，一些公司可能會選擇採用混合模式，即开放基礎模型的源代碼，但保留高級功能或特定應用的閉源。

這種模式既可以吸引开發者和用戶的參與，又可以保護公司的核心競爭力。

三是，標准化與監管的加強。

隨着AI技術的發展和應用的普及，政府和行業組織可能會加強對开源和閉源大模型的標准化和監管工作，以確保模型的安全、公平和透明。

這將進一步規範市場行爲，促進开源和閉源大模型的健康發展。

結語

當然，無論是开源還是閉源，重要的是持續創新、提升透明度和安全性，以及實現AI技術的社會價值和經濟價值的最大化。比起斷定誰會是大模型的未來，不如去關注如何合理利用這兩種模式，去塑造一個更加智能、开放、安全和可持續的AI未來。

相關閱讀

AI大模型終於走到了數據爭奪战

通用與垂直大模型之战：大模型驅動的商業智能變革之路

大模型的中場战事，深入垂直行業腹地