ChatGPT掀起了一股全球範圍內的AI浪潮,OpenAI也隨之成爲最炙手可熱的明星公司。
我們不禁好奇,爲什么是OpenAI這樣名不見經傳的小公司,而不是谷歌這種大公司創造了ChatGPT?OpenAI有何獨特的工作方法論?
目前國內大模型創業如火如荼,但不得不承認,各家產品與ChatGPT-4相比還有很大差距,爲什么在技術創新方面我們總是慢人一步?
爲此,商隱社專訪了肯尼斯·斯坦利(Kenneth Stanley),他此前在OpenAI領導了一個开放式研究小組。再之前,他是中佛羅裏達大學計算機科學專業的教授。
通過這次對話,我們得以窺見OpenAI崛起的底層邏輯。這些思維方式不僅關乎人工智能創新,也關乎我們如何擁有更自由的人生。
以下文字根據我們與肯尼斯·斯坦利教授的談話內容,以及他的新書《爲什么偉大不能被計劃》整理而成。
文 | 肯尼斯·斯坦利 OpenAI研究員、人工智能科學家
採訪及整理 | 阿空
商隱社研究團隊商業組本文爲商隱社原創文章,轉載請聯系後台
放棄對目標的神話
或許你該升個職、跳個槽、減減肥、找個對象、賺個幾百萬、买個房子。
上述社會追求的背後,存在這樣一個設想:任何值得追求的社會成就,最好先將其設定爲目標,再堅定不移地朝着這個目標努力。
這不禁讓人發問:這世界上是否存在不需要設定目標就能完成的事情?
縱觀大部分行業,答案似乎是“沒有”。
我們已經太習慣於通過“目標”來界定所有的努力,甚至忘了我們可以去質疑目標的價值。
目標提供了一種安全感,當我們感到迷惘時,機械地逐步推進目標,起碼可以讓我們擁有一種固定且可靠的生活。
因爲“設定目標”這一行爲本身,暗含着一種可能性假設:只要你用心去做,便有可能事成。只要目標明確,努力和付出必有回報。
某些時候,目標確實能爲我們提供生活的意義或方向。但它同樣限制了我們的自由,成爲禁錮我們探索欲望的牢籠。
我們常常因過分執迷於目標而錯失良多。目標論導致我們只關注終點的收獲,而忽視了每一條探索道路本身的特殊性和獨特性價值。
我們的世界充斥着爲了獲得成功而設置的各種目標,這使我們的生活變得機械化,壓抑了我們的生活熱情。
但事實上,若想實現更多所謂的豐功偉業,目標往往會成爲絆腳石,比如與探索發現、創造力、發明或創新,或者找到真正的幸福。
這是因爲,如果將我們所做的每件事,看作實現一個或另一個目標的踏腳石,那么探索任何復雜問題的過程都將是充斥無數欺騙性的踏腳石。
欺騙性往往是目標不能帶來偉大成就的關鍵原因。如果目標具有欺騙性,那么設定目標,並以此爲努力方向的做法對實現目標沒有什么幫助。
因此,實現遠大目標的最佳方式就是放棄對目標的神話,進而忽略目標。
聽起來不可思議,但OpenAI確實如此。這家公司成立的前15個月,都沒有一個明確的研究目標。
2016年5月,時任谷歌首席AI研究員參觀OpenAI,對其工作方式相當困惑。他詢問OpenAI的目標是什么,沒想到難倒了OpenAI:“我們現在的目標,就是....做點好事。”
然而數月之後,這位研究員卻毅然辭職加入了OpenAI,他想一起做點好事。
尋找一塊可能成功的踏腳石
放棄目標的困難之處在於,意味着放棄“存在正確道路”的想法。但如果目的地本就不存在,那么所謂的正確道路也不應該存在。
其實,改變世界的神奇公式並不存在。偉大的成就並沒有所謂的成功腳本,它們往往沒有經過周密的計劃便誕生。
通往成功的踏腳石,往往是未知的。因此,當進入一個充滿不確定性的世界時,對未知的機會秉持开放和靈活的態度,有時候比明確地知道自己要做什么更重要。
所有人都應該开始尋找可能通往成功的踏腳石,且無需事先設定任何特定的終點。
你必須先找到一塊正確的踏腳石來站穩腳跟,再加上足夠的運氣和頭腦,才有可能發現通向目標的道路。
在AI研究的衆多方向中,AGI(通用人工智能),便是OpenAI找到的一塊踏腳石。
所謂AGI,即“超級智能”,接近科幻電影中萬能的人工智能。與之形成對比的是人臉識別、翻譯、下圍棋等只能完成單一任務的人工智能。
但以那時候的科研基礎而言,談論AGI,就像談論如何長生不老一樣荒謬。
科學家all in AGI,賭贏,可以在教科書裏比肩牛頓;賭輸,則成爲美版知乎Quaro的民科代表。
但企業all in AGI,大概率會成爲先烈。龐大的資本支出,讓無論是相信“專家算法”的IBM,還是“深度學習”的谷歌、百度,巨頭們的一切AI研究,都爲產業化服務。
愿意成爲這個冤大頭的,只有OpenAI一家。
很多時候,盲目地堅持最初的目標並不會帶來偉大的成就。恰恰因爲帶來最偉大成果的踏腳石是未知的,所以不試圖尋找特定的東西,往往會帶來最令人興奮的發現。
踏腳石不一定意味着通往最終的目的地,它自身也無關對錯,只涉及探索的過程和無限的可能性。
我們需要接受的現實是:很多事情,是無法單純地通過努力實現的。
只有在明確的目標被忽視、探索的繮繩被徹底松开時,我們才有可能徵服最遙遠的未知邊界。
順着有趣和新奇的方向前進
事實上,與其追求某個最終目標,不如轉而尋求新奇的事物。因爲後者的回報,將是一連串的、無窮無盡的踏腳石,即一項新奇事物的產生,將帶來更多的新奇事物。
這樣一來,未來就不再是某個特定的終點,而是一條沒有盡頭、未被定義、潛力無限的道路。
新奇事物的重要性在於,它們往往可以成爲踏腳石探測器,因爲任何新奇的東西,都是催生更新奇事物的潛在踏腳石。
換句話說,新奇性是識別趣味性的一條“簡單粗暴”的捷徑,而有趣的想法往往能夠开闢全新的可能性。
新奇有趣的想法不僅遠非微不足道,而且往往還會帶來新的思維方式,進而觸發更偉大的創新和發現。
更重要的一點是,通過不斷地使新事物成爲可能,新奇性以及趣味性能隨着時間的推移產生聚合效應。
但追逐新奇性往往意味着一種漫無目的的不確定性,我們又該怎么知道要去哪裏?
這其實就是關鍵所在。最偉大的創新過程之所以會成功,正是因爲它們並不試圖去往任何特定的地方。
按照這個邏輯,我們需要放棄目標帶來的虛假安全感,轉而去擁抱未知的、瘋狂的可能性。
當然,我們仍然有理由擔心,這種對新奇性的探索令人不踏實,甚至可能有點聽天由命。
但事實並非如此。新奇性的概念不要求我們依賴一個具有欺騙性的指南針,只要求我們將當前的位置與過去進行比較。
與其擔心我們不知道要去什么地方,不如將我們現在所處的位置,與我們曾經到過的位置進行比較。
與未來不同的是,過去不存在模糊性或欺騙性。這種比較不會讓我們判斷自己朝向目標的進展如何,但可以讓我們判斷在多大程度上擺脫了過去事物的束縛。
這種比較將問題從“我們正在接近什么”,變成“我們正在逃離什么”。
而逃離過去的有趣之處在於,它能夠开啓全新的可能性。
雖然人類的直覺和預感往往促使我們朝着沒有任何目標的方向前行,但我們最終依然能發現一些與衆不同或有趣的東西。
因此,在討論新奇性時,趣味性的概念會自然而然地出現,這並不是巧合。當一個想法真正讓人感到新奇時,它就足以讓我們產生好奇心。
如果我們選擇了一條有趣的道路,它可能會通往重要的目的地,盡管我們可能並不知道這個目的地確切在哪裏。
鮮有人知的是,在OpenAI不斷迭代升級的過程中,電子遊戲也曾發揮過舉足輕重的作用。
早期的OpenAI 曾在2019年打造出名爲OpenAI Five的遊戲AI,並成功擊敗了兩屆DOTA2國際邀請賽的世界冠軍OG战隊。
這並非不務正業。
盡管當時的人工智能已經在“聽、說、看”等方面取得了一定突破,而且基於強化學習的Alpha Go也剛剛擊敗了人類圍棋世界冠軍。
但在OpenAI團隊看來,這些突破依舊沒有跳出“弱人工智能”的範疇,並不具備理解問題的和解決問題的能力。
OpenAI團隊認爲,要想讓人工智能具備這種能力,就必須將其置於更爲廣泛和復雜的環境中進行訓練,這樣才能讓人工智能發展出可以有效遷移復用的知識和解決問題的策略,而電子遊戲就是這個“訓練環境”的絕佳選擇。
而以規則復雜、要素衆多、環境多變,同時也是全球擁有超高人氣的電子遊戲DOTA 2,順理成章地成爲了OpenAI的首選。
正如OpenAI團隊所言:“相比標准的开發環境,DOTA 2顯得更加有趣,也更加困難。但是,如果一個AI能在像DOTA這樣復雜的遊戲裏超越人類,那這個AI本身就是一個裏程碑。”
相較於AI之前在國際象棋和圍棋裏取得的成就,像DOTA 2這類復雜的遊戲能更好地捕捉現實世界中的混亂和連續性,使其訓練出的AI能夠擁有更好的通用性,從而更有可能應用於遊戲之外的人類社會。
最終,OpenAI在DOTA 2上的嘗試,爲AI強化學習效率提升提供了方向,這些都成爲了ChatGPT的養分。
可以說,正是OpenAI團隊順着有趣的方向探索,才獲得了ChatGPT這樣創新的產品。
許多參與ChatGPT 創立的人並沒有想到它會成爲一個世界性的產品,引起如此大規模的反應。相反,他們只是覺得聊天很有趣,因爲聊天是一種很自然的與智能進行交互的方式。所以這不是計劃好的,純粹是一個意外。
但這並不等於說“偉大的發現都來自偶然”。這種說法的謬誤之處在於將偶然性看成一種意外。
如果偶然性發現純屬意外事件,那就意味着沒有任何特殊的教育背景或智力水平的人,也能夠得出同樣的發現。
我們或許會假設,凌亂無序或瘋狂甚至是开啓偉大發現之旅的最佳方式。但在現實世界中,情況似乎並非如此。
大多數重大的偶然性發現,都不是外行人的瘋狂想法推動的。事實上,這些偉大的發現,大多數都出自智力超群、受過良好教育,且在各自行業內頗有建樹的人之手。
在任何偶然性發現的背後,幾乎總有一位心態开放的思想家,他們對怎樣會產生最有趣的結果往往有着強烈的直覺。
歸根結底,我們必須獲得某種知識,才能繼續創造新奇事物,這就意味着新奇性探索是一種信息收集器,用於不斷積累關於世界的知識。
探索的時間越長,最終積累的信息越多,就越容易創新。
成爲一個尋寶者
創新並非少數人的專利。對許多人來說,創新是可能的,因爲我們都有不同領域的經驗,在任何你有經驗的領域,你都可以創新。例如,你會找到一種創新的方式來裝飾你的家。
然而,不是每個人都需要或者應該創新。人們應該做他們想做的事情。如果你喜歡安全的適度的目標,過着沒有風險的生活,那也可以是一種美好的生活。
如果你更喜歡探險冒險和不確定的目標,那也是一條合理的道路,只要你接受它可能走不通的風險。簡而言之,就個人而言,每個人應該有選擇自己喜歡的道路的自由。
對於後者而言,我們需要從目標的“一招鮮,喫遍天”的虛妄幻想中解放出來,繼而擁抱現實,讓自己成爲一名擁有“即便沒有目標,也能發現意外之喜”這種強大能力的“尋寶者”。
在漫無目標的新奇性探索中,你不一定能找到心中想要的寶藏,反而可能發現許多意料之外的寶藏,這將使整個過程充滿驚喜。
本質上,尋寶者又可以說是秉持機會主義的探險家,他們致力於尋找任何有價值的東西,而不在乎這些東西具體是什么。
要想成爲一名合格的尋寶者,我們就必須盡可能多地積累踏腳石,因爲我們永遠不知道哪塊踏腳石可能通往有價值的地方。
也就是說,我們需要保持多樣化的思維。因爲一心一意地追求某個特定目標太有欺騙性,所以我們應該盡可能保留不同選擇的可能性,以防一开始看起來最靠譜的路徑,到後來反而行不通。
這種看法聽起來或許很悲哀,因爲人類沒有關於未來的確切指南針。我們爲創造確定性和有目標的努力所做的一切,都可能是徒勞無功的。
但我們完全不必失望,也許探索和發現本身就不應該專注於具體的目標,而是應着眼於一些更偉大的東西。
很反常識的一點是,達成共識並不是尋寶者的工作方式。有時候通往創造性想法的最佳路徑,就是遵循個人喜好,而無需任何共識和目標。
事實上,沒人能對2022年ChatGPT的爆發胸有成竹。過去5年,30多名中高層離开OpenAI,各自开闢AI創業項目。
他們的創業項目清單裏,囊括了語言理解、計算機視覺、視覺搜索引擎、計算機任務自動化、太空技術、人工智能安全等AI各個領域,既包括AI大模型的底層技術,也有中間層和具體的應用層。
這無疑都是推動AI發展的有益探索。
OpenAI創始人薩姆·阿爾特曼曾篤定地表示,在公司內部,即使是管理層,也不一定有工程師了解這個300多人的團隊。
OpenAI作爲平台給這些工程師提供充分的自由和自信,包括他們在離开公司後獨立創業,也得益於OpenAI長期形成的公司文化。
OpenAI內部研究小組之間的“不團結”,有時候反而可以推動進步。這樣一來,“不團結”的力量,可以幫助更好地組織科學探索和其他創造性的工作。
總結
當探索的目的地變得未知,我們必須放下對最終目的地的執念。
這就是“踏腳石原則”,即一個好的想法會帶來另一個好的想法;一處寶藏會指向更多的寶藏,在可能發現的無限的踏腳石上,形成源源不斷的連鎖和分支。因此,你需要做的,就是成爲一個熟練的尋寶者。
如果你想成爲一名行事無須設置特定目標的尋寶者,那么就要遵循一種特殊的线索,即當某些東西讓你感覺有趣時,尋寶的旅程就可以开啓。
“踏腳石原則”反映在工作中,就是讓我們更有信心跟隨自己的直覺,僅僅是因爲它們看起來很有趣,即使不確定回報會是什么。
實際上,目標驅動的公司往往因爲在幾年內沒有推出創新的產品而萎靡不振。在人工智能的商業化領域,充斥着不少雄心勃勃的公司,它們最後不得不降低自己的期望值。還有很多公司陷入到了爭分奪秒的軍備競賽中,數據積累和技術耐心成爲難以避免的犧牲品。
成功的人往往會問的是,我們能夠從這裏走到哪裏,而不是我們如何能夠抵達遙遠的那裏。他們並沒有將精力浪費在遙遠而宏偉的愿景上,而是專注於當前可能發生的前沿事件。
根據當前所處的位置,決定應該去哪裏,往往比根據想要去哪裏,來決定前進的方向要更明智。
原文標題 : 專訪ChatGPT背後的科學家:OpenAI的300人工作方法論
標題:專訪ChatGPT背後的科學家:OpenAI的300人工作方法論
地址:https://www.utechfun.com/post/244675.html