霸榜測評的开源大模型，爲何是阿拉伯人搞出來的？

2023-09-11 18:40:16 編輯： robot

導讀搞大模型，光有錢可不行。在當下的大模型賽道上，开源大模型已經成了一股愈發無法忽視的力量。無論是Meta的LLMA2，還是國內的百川大模型，都在競相迭代，渴望在這場AI浪潮中取得更...

搞大模型，光有錢可不行。

在當下的大模型賽道上，开源大模型已經成了一股愈發無法忽視的力量。

無論是Meta的LLMA2，還是國內的百川大模型，都在競相迭代，渴望在這場AI浪潮中取得更多優勢。

然而，就在中美AI企業角力之時，“評分最高开源大模型”的桂冠，卻突然在一夜之間被阿拉伯人拿下了。

這個驚爆全網的开源大模型名爲Falcon 180B，由阿聯酋的技術創新研究所（TII）开發。

一經推出，Falcon 180B就在推理、編碼、熟練度和知識測試各種任務中，一舉擊敗了Llama 2。

於是，由3.5萬億token訓練而成的Falcon 180B，迅速了登頂Hugging Face排行榜。

在HellaSwag、LAMBADA、WebQuestions等測試中，Falcon 180B已經能夠與谷歌PaLM 2不差上下，性能直逼GPT-4。

同時，在Hugging Face开源大模型榜單上，Falcon 180B也是當前評分最高（68.74分）的开源大模型，超越了LlaMA 2（67.35）。

看到這兒，問題來了：在很多人的印象中，阿聯酋是一片充滿沙漠，以石油爲主要收入的國家，那么，這么個往日的“石油大國”，怎么就突然在AI領域一飛衝天，驚詫中美，並在开源領域傲視群雄了呢？

這片遍地黃沙的地方，究竟有着怎樣的科研優勢？

01 軟實力的重要性

這個“世界最強开源大模型”並非誕生在私營的科技企業，而是誕生在阿聯酋正兒八經的國立科研機構TII，這是個很值得玩味的事。

身爲由政府資助的科研機構，TII在論資金、資源、算力等方面，自然是不必發愁。

例如在算力方面，TII擁有阿聯酋最大的超級計算機——阿布扎比超級計算機（Abu Dhabi Supercomputer），它擁有超過10萬個處理器核心，能夠實現每秒20億次浮點運算（PFLOPS），是全球第15強的超級計算機之一。

然而，用舉國體制砸資源、砸設備來“大力出奇跡”這種事兒，很多國家都會做，但爲什么偏偏阿聯酋卻異軍突起了？

實際上，除了算力、數據這些大模型必須的“標配”外，真正令TII脫穎而出的變量，就是人才、組織結構、政策等一系列“軟實力”。

而在這方面，首先值得一提的，就是TII的領導者——法赫德·阿爾奧拉伊尼（Fahad Al-Olayan）。

身爲國立科研機構的領導者，法赫德既不是科學院的院士，也不是知名大學的教授、專家，而是阿聯酋最大的私營控股公司——奧拉伊尼集團 (Olayan Group).的創始人和董事會主席。

請私企的企業家來領導國立科研機構，這在世界上是非常罕見的。

那阿聯酋爲何這么劍走偏鋒？實際上，這是由於阿聯酋的副總理阿勒馬克圖姆酋長看中了法赫德“搞科技”的才能。

奧拉伊尼集團大樓

具體來說，在加入TII之前，法赫德先是在1997年創立了Axiom Telecom，這是阿聯酋，也是中東地區最大的移動設備分銷商之一。與蘋果、三星、華爲等多個國際品牌都有合作夥伴關系。

而在2014年時，法赫德又創立了阿聯酋最大的網絡安全公司DarkMatter，專爲政府、企業和個人提供各種網絡安全解決方案。

後來，法赫德加入了阿聯酋人工智能委員會（UAE AI Council），在疫情期間，他與阿聯酋國防部合作，开發了一種基於人工智能的新型冠狀病毒檢測方法，能在幾秒鐘內通過呼吸分析來診斷感染者。

法赫德創立的Axiom Telecom

正是由於這一系列亮眼的履歷，副總理阿勒馬克圖姆心動了，產生了想將法赫德聘爲TII總管的想法。

然而，這樣大膽的舉動，光憑政府領袖個人的意志還不行，得有相應的法律、政策保障。

在阿聯酋的科研之路上，許多高層領導都認識到私營部門和公共部門之間的合作的重要性。於是，阿聯酋便專門制定了一系列法律和規章，爲私營和公共部門之間的合作提供了便利和保障，如《私營部門參與法》、《公私合作法》等。

TII研究大樓

而正是有了這樣政策上的便利，法赫德才最終得以進入TII這個國立科研機構，並將自己過去經營企業所練就的一系列管理經驗和技巧，應用在了科研項目的運作中。

02 組織結構

在法赫德擔任TII的總管後，很快便用自己的方式，重塑了整個TII的組織結構。

可以說，現在的TII，雖然名義上是一個非盈利的國立科研機構，但實際上卻是以一種企業的方式在運行的。

在管理TII時，法赫德採用了扁平化、集約化的組織管理模式，同時賦予項目負責人更大的自主權和決策權，實現資源的優化配置和利用。

具體來說，他將TII的組織結構簡化爲三個層次：首席執行官、首席研究員和項目負責人。

首席執行官是TII的最高決策者，負責制定TII的战略方向和發展目標，以及與政府、企業、學術機構等外部利益相關者的關系維護。

首席研究員是TII的核心領導團隊，負責制定各自研究領域的研究計劃和預算，以及監督和評估各個項目的進展和成果。

項目負責人是TII的基層管理者，負責執行各自項目的具體任務和活動，以及匯報和反饋項目的狀態和問題。

在這樣的管理模式下，下屬科學家、研究員和工程師可以直接與首席研究員溝通和協作，無需經過多層的審批和匯報。

同時，TII賦予了基層員工一定的決策權和創新空間，讓他們可以在項目過程中，根據實際情況或反饋結果，及時修改或優化項目方案，提高項目的成功率和影響力。

講真，這樣的管理模式，實際上已經比目前的一些科技巨頭，如谷歌、Meta要高效、靈活多了。

而相較之下，一些從谷歌離職的研究者表示，現在的Google反而被籠罩在了類似學術或政府機構的企業文化之下，充斥官僚主義。

一些谷歌匿名高管曾表示，谷歌決策緩慢，是因爲皮查伊在考慮決策時過於謹慎，拖延了行動，才在後來被OpenAI反超。

一家政府機構越來越像企業，而一個科技企業卻越來越像官僚化的政府機構。

這不得不說是一個很諷刺的現象。

而這種反差的背後，則是兩者截然不同的基本盤所致。

就目前來說，大模型，尤其是通用大模型，仍然是一種“技術先於應用”的研究。換句話說，很多研究團隊，在研究通用大模型時，實際上並不知道大模型之後的具體應用場景。

但對谷歌、Meta這些商業版圖龐大的巨頭來說，其在推進具體的研究項目時，往往不能不優先考慮產品化和收益的問題。

而在商業化問題上的謹慎，則導致了其在決策層面的遲緩。

但TII則不同，由於其負責的主體是阿聯酋的政府和王室，而非企業股東，因此在一些較爲前沿，但產出卻不明確的項目上，反而可以放开了手腳去幹。

而阿聯酋政府和王室，之所以如此不怕“燒錢”，除了自身確實土豪外，另一部分原因，則是出於對“後石油”時代的未雨綢繆。

畢竟，在全球能源結構變化、環境保護的呼聲和經濟形勢變化的大背景下，石油資源的不可持續性，已經愈發明顯。

因此，尋求經濟多元化發展，就成了維持國家的持續繁榮的必要途徑。

在此背景下，AI等新興的科技產業，就成爲了阿聯酋等阿拉伯國家所仰賴的一個重要支柱。

03 總結

除了上述提到的因素外，阿聯酋在AI方向上，至少還有兩大優勢性的政策，爲大模型的發展鋪好了路。

其一就是通過極其優渥的人才政策，吸引了全球各地的AI人才。

在這方面，阿聯酋通過頒發長期的黃金籤證和遠程工作籤證，留住了來自全球的AI人才。

這兩種籤證都是阿聯酋政府在2019年推出的新型籤證，旨在吸引全球的創新者、專業人士和企業家。

黃金籤證是一種爲期10年的長期居留籤證，可以自動續籤，適用於科學家、醫生、工程師、藝術家等領域的傑出人才。

遠程工作籤證是一種爲期一年的臨時居留籤證，可以延長或轉換爲其他類型的籤證，適用於在其他國家有穩定收入的遠程工作者。

這兩種籤證都爲AI人才提供了一個靈活和便利的居住和工作環境。

其二，就是在AI倫理方面走得早，比較遠。

目前，生成式AI造成的倫理、法律問題，已經成了技術因素之外，另一大制約產業發展的因素。

很多時候，明明技術到位了，但卻因爲法律、合規方面的原因，導致很多應用和項目遲遲難以落地。

例如AI作圖的版權問題，就是一個明顯的例子。

而在阿聯酋政府在2018年成立了AI倫理委員會，這是全球首個國家級的AI倫理機構，旨在監督和指導AI在阿聯酋的發展和應用，保護個人和社會的權益和福祉。

阿聯酋政府還在2019年發布了《阿聯酋人工智能倫理原則》，這是全球首個國家級的AI倫理文件，旨在爲AI的設計、开發和使用提供一個統一和明確的道德框架，涉及公平、透明、責任、隱私、安全等方面。

可以說，在當下的AI革命面前，阿聯酋做出了一系列大膽的嘗試。

而這樣的嘗試，都是爲了破除各種橫亙在AI發展之路上的壁壘。