搞大模型,光有錢可不行。
在當下的大模型賽道上,开源大模型已經成了一股愈發無法忽視的力量。
無論是Meta的LLMA2,還是國內的百川大模型,都在競相迭代,渴望在這場AI浪潮中取得更多優勢。
然而,就在中美AI企業角力之時,“評分最高开源大模型”的桂冠,卻突然在一夜之間被阿拉伯人拿下了。
這個驚爆全網的开源大模型名爲Falcon 180B,由阿聯酋的技術創新研究所(TII)开發。
一經推出,Falcon 180B就在推理、編碼、熟練度和知識測試各種任務中,一舉擊敗了Llama 2。
於是,由3.5萬億token訓練而成的Falcon 180B,迅速了登頂Hugging Face排行榜。
在HellaSwag、LAMBADA、WebQuestions等測試中,Falcon 180B已經能夠與谷歌PaLM 2不差上下,性能直逼GPT-4。
同時,在Hugging Face开源大模型榜單上,Falcon 180B也是當前評分最高(68.74分)的开源大模型,超越了LlaMA 2(67.35)。
看到這兒,問題來了:在很多人的印象中,阿聯酋是一片充滿沙漠,以石油爲主要收入的國家,那么,這么個往日的“石油大國”,怎么就突然在AI領域一飛衝天,驚詫中美,並在开源領域傲視群雄了呢?
這片遍地黃沙的地方,究竟有着怎樣的科研優勢?
01 軟實力的重要性
這個“世界最強开源大模型”並非誕生在私營的科技企業,而是誕生在阿聯酋正兒八經的國立科研機構TII,這是個很值得玩味的事。
身爲由政府資助的科研機構,TII在論資金、資源、算力等方面,自然是不必發愁。
例如在算力方面,TII擁有阿聯酋最大的超級計算機——阿布扎比超級計算機(Abu Dhabi Supercomputer),它擁有超過10萬個處理器核心,能夠實現每秒20億次浮點運算(PFLOPS),是全球第15強的超級計算機之一。
然而,用舉國體制砸資源、砸設備來“大力出奇跡”這種事兒,很多國家都會做,但爲什么偏偏阿聯酋卻異軍突起了?
實際上,除了算力、數據這些大模型必須的“標配”外,真正令TII脫穎而出的變量,就是人才、組織結構、政策等一系列“軟實力”。
而在這方面,首先值得一提的,就是TII的領導者——法赫德·阿爾奧拉伊尼(Fahad Al-Olayan)。
身爲國立科研機構的領導者,法赫德既不是科學院的院士,也不是知名大學的教授、專家,而是阿聯酋最大的私營控股公司——奧拉伊尼集團 (Olayan Group).的創始人和董事會主席。
請私企的企業家來領導國立科研機構,這在世界上是非常罕見的。
那阿聯酋爲何這么劍走偏鋒?實際上,這是由於阿聯酋的副總理阿勒馬克圖姆酋長看中了法赫德“搞科技”的才能。
奧拉伊尼集團大樓
具體來說,在加入TII之前,法赫德先是在1997年創立了Axiom Telecom,這是阿聯酋,也是中東地區最大的移動設備分銷商之一。與蘋果、三星、華爲等多個國際品牌都有合作夥伴關系。
而在2014年時,法赫德又創立了阿聯酋最大的網絡安全公司DarkMatter,專爲政府、企業和個人提供各種網絡安全解決方案。
後來,法赫德加入了阿聯酋人工智能委員會(UAE AI Council),在疫情期間,他與阿聯酋國防部合作,开發了一種基於人工智能的新型冠狀病毒檢測方法,能在幾秒鐘內通過呼吸分析來診斷感染者。
法赫德創立的Axiom Telecom
正是由於這一系列亮眼的履歷,副總理阿勒馬克圖姆心動了,產生了想將法赫德聘爲TII總管的想法。
然而,這樣大膽的舉動,光憑政府領袖個人的意志還不行,得有相應的法律、政策保障。
在阿聯酋的科研之路上,許多高層領導都認識到私營部門和公共部門之間的合作的重要性。於是,阿聯酋便專門制定了一系列法律和規章,爲私營和公共部門之間的合作提供了便利和保障,如《私營部門參與法》、《公私合作法》等。
TII研究大樓
而正是有了這樣政策上的便利,法赫德才最終得以進入TII這個國立科研機構,並將自己過去經營企業所練就的一系列管理經驗和技巧,應用在了科研項目的運作中。
02 組織結構
在法赫德擔任TII的總管後,很快便用自己的方式,重塑了整個TII的組織結構。
可以說,現在的TII,雖然名義上是一個非盈利的國立科研機構,但實際上卻是以一種企業的方式在運行的。
在管理TII時,法赫德採用了扁平化、集約化的組織管理模式,同時賦予項目負責人更大的自主權和決策權,實現資源的優化配置和利用。
具體來說,他將TII的組織結構簡化爲三個層次:首席執行官、首席研究員和項目負責人。
首席執行官是TII的最高決策者,負責制定TII的战略方向和發展目標,以及與政府、企業、學術機構等外部利益相關者的關系維護。
首席研究員是TII的核心領導團隊,負責制定各自研究領域的研究計劃和預算,以及監督和評估各個項目的進展和成果。
項目負責人是TII的基層管理者,負責執行各自項目的具體任務和活動,以及匯報和反饋項目的狀態和問題。
在這樣的管理模式下,下屬科學家、研究員和工程師可以直接與首席研究員溝通和協作,無需經過多層的審批和匯報。
同時,TII賦予了基層員工一定的決策權和創新空間,讓他們可以在項目過程中,根據實際情況或反饋結果,及時修改或優化項目方案,提高項目的成功率和影響力。
講真,這樣的管理模式,實際上已經比目前的一些科技巨頭,如谷歌、Meta要高效、靈活多了。
而相較之下,一些從谷歌離職的研究者表示,現在的Google反而被籠罩在了類似學術或政府機構的企業文化之下,充斥官僚主義。
一些谷歌匿名高管曾表示,谷歌決策緩慢,是因爲皮查伊在考慮決策時過於謹慎,拖延了行動,才在後來被OpenAI反超。
一家政府機構越來越像企業,而一個科技企業卻越來越像官僚化的政府機構。
這不得不說是一個很諷刺的現象。
而這種反差的背後,則是兩者截然不同的基本盤所致。
就目前來說,大模型,尤其是通用大模型,仍然是一種“技術先於應用”的研究。換句話說,很多研究團隊,在研究通用大模型時,實際上並不知道大模型之後的具體應用場景。
但對谷歌、Meta這些商業版圖龐大的巨頭來說,其在推進具體的研究項目時,往往不能不優先考慮產品化和收益的問題。
而在商業化問題上的謹慎,則導致了其在決策層面的遲緩。
但TII則不同,由於其負責的主體是阿聯酋的政府和王室,而非企業股東,因此在一些較爲前沿,但產出卻不明確的項目上,反而可以放开了手腳去幹。
而阿聯酋政府和王室,之所以如此不怕“燒錢”,除了自身確實土豪外,另一部分原因,則是出於對“後石油”時代的未雨綢繆。
畢竟,在全球能源結構變化、環境保護的呼聲和經濟形勢變化的大背景下,石油資源的不可持續性,已經愈發明顯。
因此,尋求經濟多元化發展,就成了維持國家的持續繁榮的必要途徑。
在此背景下,AI等新興的科技產業,就成爲了阿聯酋等阿拉伯國家所仰賴的一個重要支柱。
03 總結
除了上述提到的因素外,阿聯酋在AI方向上,至少還有兩大優勢性的政策,爲大模型的發展鋪好了路。
其一就是通過極其優渥的人才政策,吸引了全球各地的AI人才。
在這方面,阿聯酋通過頒發長期的黃金籤證和遠程工作籤證,留住了來自全球的AI人才。
這兩種籤證都是阿聯酋政府在2019年推出的新型籤證,旨在吸引全球的創新者、專業人士和企業家。
黃金籤證是一種爲期10年的長期居留籤證,可以自動續籤,適用於科學家、醫生、工程師、藝術家等領域的傑出人才。
遠程工作籤證是一種爲期一年的臨時居留籤證,可以延長或轉換爲其他類型的籤證,適用於在其他國家有穩定收入的遠程工作者。
這兩種籤證都爲AI人才提供了一個靈活和便利的居住和工作環境。
其二,就是在AI倫理方面走得早,比較遠。
目前,生成式AI造成的倫理、法律問題,已經成了技術因素之外,另一大制約產業發展的因素。
很多時候,明明技術到位了,但卻因爲法律、合規方面的原因,導致很多應用和項目遲遲難以落地。
例如AI作圖的版權問題,就是一個明顯的例子。
而在阿聯酋政府在2018年成立了AI倫理委員會,這是全球首個國家級的AI倫理機構,旨在監督和指導AI在阿聯酋的發展和應用,保護個人和社會的權益和福祉。
阿聯酋政府還在2019年發布了《阿聯酋人工智能倫理原則》,這是全球首個國家級的AI倫理文件,旨在爲AI的設計、开發和使用提供一個統一和明確的道德框架,涉及公平、透明、責任、隱私、安全等方面。
可以說,在當下的AI革命面前,阿聯酋做出了一系列大膽的嘗試。
而這樣的嘗試,都是爲了破除各種橫亙在AI發展之路上的壁壘。
這些壁壘有政府與私營企業之間的,有不同文化、國家之間的,也有倫理與法律方面的。
在這個科技變革的關口,人類的一系列制度、法律和文化等上層建築,已經开始對新興的AI技術表現出了不適和滯後。
而關於如何破除這種“不適”、“錯位”,讓人類通向AGI的道路更加平坦,阿聯酋做出了一個較好的表率。
原文標題 : 霸榜測評的开源大模型,爲何是阿拉伯人搞出來的?
標題:霸榜測評的开源大模型,爲何是阿拉伯人搞出來的?
地址:https://www.utechfun.com/post/260848.html