谷歌CEO最新訪談:AI要打持久战 量子計算突破令人興奮

2024-12-15 18:10:34    編輯: robot
導讀   本周,谷歌CEO桑達爾·皮查伊(Sundar Pichai)度過了他幾年來最美好的一周。因爲谷歌取得了一系列大大小小的勝利,從諾貝爾獎頒獎典禮,到突破性的新AI模型Gemini 2.0,再到量子...

  本周,谷歌CEO桑達爾·皮查伊(Sundar Pichai)度過了他幾年來最美好的一周。因爲谷歌取得了一系列大大小小的勝利,從諾貝爾獎頒獎典禮,到突破性的新AI模型Gemini 2.0,再到量子計算的突破。

  日前,美國新銳媒體Semafor科技編輯裏德·阿爾伯戈蒂(Reed Albergotti)在山景城採訪了皮查伊。今年是皮查伊擔任谷歌CEO的第十個年頭,無論是在壓力之下,還是被勝利所圍繞,他總是能保持平穩。

  自2022年11月ChatGPT發布以來,谷歌的發展一直很坎坷,至少從外部來看是這樣。傳統觀點認爲,谷歌不知何故錯過了ChatGPT時刻,感到恐慌。但皮查伊表示,他從未懷疑過公司的長期計劃,選擇堅持到底,打持久战。

  皮查伊還表示,當唐納德·特朗普(Donald Trump)明年入主白宮時,他將積極參與美國新政府的AI“曼哈頓計劃”。

  以下爲採訪內容摘要:

  問:對谷歌而言,這是一個十分瘋狂的一周,所有的產品公告,量子計算突破,諾貝爾獎,還有新AI模型Gemini 2.0。這都是你們計劃好的嗎,還是因爲AI的瘋狂所導致的?

  皮查伊:2015年,我讓公司朝着AI優先的方向發展。作爲其中的一部分,我們表示,將從世界級的研究开始,對AI進行深入、全棧的研究,建立基礎設施。然後爲我們开發人員構建模型,並將其放入我們的產品中。這種深度投資貫穿了我們作爲一家公司、谷歌和Alphabet所做的一切。這是基礎,採取深度技術創新方法,全棧方法。然後在當前的生成式AI時代,有時你會投資來提前做好事情。對我來說,這就是從頭开始建立谷歌DeepMind,啓動Gemini,並將其構建爲原生多模式和長上下文,現在進入2.0版本。

  所以,要打好基礎,調整團隊,建立公司。我想你已經看到了所有這些裨益已經开始提供給消費者了。我預計我們的速度會更快,因爲總是有固定的成本。我們必須大規模地准備我們的TPU,以構建我們想要構建的模型,建設我們的數據中心,組建合適的團隊。創新管道感覺非常非常強大。其中一些是長期賭注,需要時間來完成。在我看來,量子計算就像AI在2010年左右的樣子。很少有人知道這件事,但你正在有條不紊地處理它。這是一樣的。至於Waymo,我們已經走過了15的歷史,這是一個激動人心的時刻,所以這可能是所有這些子的結合。諾貝爾獎不是計劃好的,但當它發生時我說了這句話:我覺得看着Demis Hassabis和John Jumper(榮獲2024年諾貝爾化學獎),他們的團隊,以及在AlphaFold上的工作,我很榮幸從頭到尾都能看到諾貝爾獎的作品。所以這是錦上添花。

  問:一兩年前,人們的說法是,谷歌被ChatGPT打得措手不及。而本周是一個很好的時機,看看你在公司方面取得了多大的進步,以及人們對谷歌的看法。你現在感覺不一樣了嗎?

  皮查伊:這是一個激動人心的時刻。在內部,我明顯感覺到我們正在取得的進步。當你在研究AI模型時,你會看到所有這些損失曲线(loss curve),以及模型的能力。有各種基准做證。我們擁有世界級的人才,可以獲得最先進的資源。谷歌DeepMind和谷歌研究(Google Research)的結合,是當前生成式AI領域引用最多的。我們會對這場革命正在發生的許多突破負責。看到這種勢頭,我們肯定非常滿意。但我們計劃做得更多,這才剛剛开始。

  問:你上周在《紐約時報》DealBook會議上說,AI進展越來越難,低垂的果實已經摘下來了。這到底是什么意思?被摘下的低垂的水果是什么?那真正困難的是什么?

  皮查伊:爲了明確我的答案,我在那裏說了。事實上,我對未來的進展感到非常興奮。我的意思是,我認爲在這個領域,你可以投入計算,並取得初步進展。但是,這不僅僅是一個擴大規模的問題,而是實現突破。因此,讓我們的模型使用多達200萬個令牌作爲輸入長度,這就是長上下文。這是一個突破的例子。使用Gemini 2.0,我們有一個多模式實時API,所以現在它可以進行本地圖像和音頻輸出。它支持流式傳輸,讓用戶實時看到模型的輸出,而不是等到整個響應生成完畢。這些都是突破。當我們進入下一個階段時,你需要更具洞察力的突破。我認爲,這項工作的質量將相當高。我想說的是,我認爲這將有助於區分真正的精英團隊。不僅僅是我們,還有其他幾個團隊,這會讓2025年更令人興奮。

  問:我明白了,是人們理解錯了。外界的理解是,你們的發展已經進入了平穩期,甚至是停滯期。但你的意思是,在谷歌,當事情變得艱難時,反而會大放異彩?

  皮查伊:沒錯。Waymo也是一樣。許多人都在努力解決這個問題,但後來變得更難了。當它變得更難時,能夠克服它,達到下一個水平,這很重要。

  問:人們傾向於將過去兩年的發展視爲曲线。如果這樣看,確實像我們正在達到一個平穩期。如果你縮小視野,看看那條曲线,我想你看到的路上會有一些停滯。你認爲它會從這裏走向何方?這是同一條軌跡嗎?

  皮查伊:我仍然清楚地記得2010年左右,我剛剛意識到這個模型幾乎無法識別圖像,並對此感到興奮。在過去的十年裏,進步是無情的。現在,它無疑將更廣泛的公衆擴展到了這個領域,所以它是主流。但當我展望2025年時,我肯定認爲我們現在已經有了足夠多的功能模型,我們可以在其上構建許多用例。

  這一進展將是非常真實的。有了Gemini 2.0,我們正在爲它更具代理性奠定基礎。雖然它仍在研究範圍內,但我們將它交給值得信賴的測試人員,比如Project Mariner,從一开始就在Chrome上工作。看到一個模型能夠使用瀏覽器是非常不可思議的,但我們必須突破一些障礙,因爲我們在這些領域必須安全、可靠地做到這一點。俗話說,“最後的20%需要80%的努力。”在這種情況下,最後10%可能需要90%的努力。但這就是爲什么我們要有基准。我們正在取得進展。我們正在把它交給值得信賴的測試人員。這樣我們就可以負責任地進行測試,獲得反饋,然後將其提供給更多的人,等等。但想想AI可以开始影響世界上的所有工作流程。我們實際上可能會看到比我們所看到的更大的進步。兩者同時爲真。

  問:說到長期策略,從一开始就與Gemini進行多模式合作似乎犧牲了一些其他能力(也許是在語言和編碼方面),是這樣嗎?

  皮查伊:當我們推出Gemini 1.2時,我們真的希望它從一开始就是多模式的。我認爲我們的模型在多模態方面幾乎是最先進的,但我們還沒有展示出模型的能力。沒有本地圖像輸出或音頻輸出。在2.0版本中,我們正在解鎖這些功能,但與此同時,我們在所有編碼或推理等方面都變得最先進。在SWE基准下,我們的模型現在是最先進的。我們還有其他尚未發布的實驗模型,這些模型顯示了更多的功能。我們肯定在推動前沿,但我們會負責任地做到這一點,這就是爲什么你會看到其中一些處於可信任的測試模式,其中一些僅作爲开發人員的實驗API,但我們將努力工作,獲得反饋,然後將其提升到一個新的水平。

  問:DeepMind的人說了這一點,並提出理論,認爲多模型方法是通往AGI的道路,因爲你需要有這個世界模型,也許你需要有一個具體的AI,才能真正推理和理解。隨着你的進步,你發現這是真的嗎?你認爲這是正確的方法嗎?

  皮查伊:作爲人類,我們與世界的體驗是令人難以置信的多模式的,所以它總是有意義的。這就是爲什么我們使用Google Lens進行搜索。如果你能把手機指向你正在看的東西並問問題,你就不應該總是打字。Lens每月爲我們帶來數十億次查詢,這是我們增長最快的用例之一。我一直很清楚,這就是未來的發展方向。Demis和他的團隊,一直有着強烈的愿景。作爲這一切的一部分,我們推出的一件事是,你可以用它來幫助遊戲。如果你是一名新玩家,它會關注你在做什么,並與你交談以提供反饋。我認爲這是它的基礎。從長遠來看,當你看到機器人技術之類的東西時,這將是非常重要的,尤其是對於Waymo。Waymo就是看你周圍的世界並做出決定。我們正在使用這些原生多模式模型進行的工作將與Waymo相交,並隨着時間的推移使Waymo變得更好。

  問:當你把這些多模式產品交到數十億人手中,看看Astra,當它廣泛可用時,它真的成爲一個很好的訓練數據來源嗎?這對谷歌來說是一個優勢嗎?

  皮查伊:在我們所做的一切中,沒有什么比真實世界的反饋更好的了。人們在搜索中使用Google Lens,人們在使用Astra。我認爲良性循環對我們的產品來說變得非常重要。我認爲這一切都讓我們的產品變得更好。例如,如果你看看Waymo,我們模擬了很多,然後我們在現實世界中开車。但現在我們在現實世界中,部署在城市中,每周提供17.5萬次出行服務,約100萬英裏。我認爲這是你創造性地改進產品的最佳方式。

  問:明年有10座城市,這很快。你認爲這會成爲真正的收入來源嗎?標准是什么?按每英裏收費嗎?

  皮查伊:我們現在的衡量標准是確保我們正在構建一個通用的Waymo駕駛程序。我們可以採取的情況越多,規模就越大,使其在城市環境、高速公路和所有天氣條件下都能以很高的標准安全工作。然後在各種場景中交付它(在我們的汽車中,與合作夥伴合作,就像他們與Uber或其他參與者的合作一樣),讓它擴大規模,擁有良好的用戶體驗是我們在努力解決這個問題時所考慮的。

  問:有一件事我沒想到會發生,那就是數據中心的名字,比如Colossus、Rainier。你在堪薩斯城有一個價值數十億美元的數據中心。你是打算建立一個這樣的大型集群,還是已經建立了?會有名字嗎?

  皮查伊:從現在开始,我們應該讓Gemini接管我們的命名。我們一直在推動數據中心的最新技術,我認爲我們有一些世界上最強大的集群。我感到自豪的是,世界上大部分地區都在採用液體冷卻。我們在數據中心廣泛部署液體冷卻已經有一段時間了。我們將成爲首批客戶之一,不僅是TPU,還將與英偉達合作,在我們的數據中心獲得GB200。我們已經有一個部分由地熱驅動的數據中心。我們的頂級數據中心,其中許多在能源使用方面都是90%無碳的。所以我們處於領先地位,我們正在擴大規模。我所看到的一切,我們所制定基准的一切,我認爲我們也處於前沿。

  問:但你不會像其他人那樣談論它。亞馬遜宣布要部署數十萬個他們的Trainium2芯片。你在TPU上訓練了Gemini 2.0,爲什么不出去吹噓一下呢?

  皮查伊:我記得在2017年或2018年的谷歌IO上,我談到了建立AI優先的數據中心,並展示了我們的TPU部件。也許我們已經做了一段時間了。我們爲我們所做的事情感到自豪,但我會接受你的建議,並確保我們更多地討論它。

  問:也許這是商業祕密;也許如果你處於領先地位,你就不必談論它。你能把這些被認爲是世界上最大的集群中的一些進行比較嗎?

  皮查伊:需要明確的是,有幾家公司在做這件事。重要的是,爲了生成用於預培訓的尖端模型,你需要這些大型集群,理想情況下是同時定位的。我們在這方面絕對處於領先地位。我認爲我們有一些最大的計算集群可供谷歌DeepMind和我們的雲客戶使用。我們將在那裏做得更多。

  問:即將上任的特朗普政府提出了AI的“曼哈頓計劃”。你對這將是什么樣子以及Alphabet將在其中扮演什么角色有什么見解嗎?

  皮查伊:現在還爲時過早。過渡團隊正在那裏進行,但總統非常明確地表示,他希望投資於技術領導力和關鍵技術。在我看來,多年來我們一直這樣做,但我們想提供幫助。你看到了我們關於量子計算或AI的公告,我們宣布了與合作夥伴一起建造小型模塊化核反應堆的團隊。其中一些是大型的實體基礎設施項目。我認爲我們有機會作爲一個國家共同努力,實施這些雄心勃勃的大型項目,並回到那個階段。世界上沒有人對看到SpaceX助推器以這種方式返回並着陸不感興趣。我認爲設定一個高標准,追求這些大型的實體基礎設施項目,並把它做得又好又快。稅率的進步是我們非常興奮的事情,我們很樂意盡我們所能發揮作用。

  問:你和新的AI沙皇談過了嗎?

  皮查伊:還沒有,但我期待着與David Sacks會面。很明顯,會有一些人走進來,他們是這些領域的技術專家。我認爲這將非常非常有幫助。我們期待着參與其中。

  問:所以還沒有具體細節,你不知道那會是什么樣子?

  皮查伊:是的。除了早期跡象表明他們肯定有興趣推動大規模創新。我們期待着這些對話。

  問:你們的量子AI團隊在糾錯方面取得了重大突破。你預料到了嗎?你的反應是什么?

  皮查伊:令人興奮的事情之一是我們的量子團隊,與Hartmut Neven和團隊一起,他們一直有一個非常嚴格的框架,他們在這一明確的裏程碑中定義了進展。每次我們有一個裏程碑,我都覺得,這些都是雄心勃勃的項目。這無疑是最積極的驚喜之一。這絕對是一個更深層次的突破,在量子計算機中擴展時解決了糾錯問題。這無疑是該領域最嚴峻的挑战之一。我對此非常滿意。但對我們來說,這些都是我們專注於开發實用量子計算機的裏程碑,我們可以將其應用於新的新穎應用案例。這就是目標。這與我們的Waymo或AI旅程相似,都需要時間。但我認爲,如果你下定決心,進步是不可避免的。

  問:你說量子就像2010年的AI。這意味着它很快就會开始產生真正的影響。實現大規模量子計算機對Alphabet意味着什么?

  皮查伊:對於你之前的問題,經典計算或超級計算機正變得越來越強大。但我認爲,對於某些類型的用例,量子最終將發揮強大的作用。它將成爲我們武器庫中的重要工具。未來,量子和AI的交叉對我們來說非常令人興奮。我們與GenCast一起發布了最先進的天氣預報模型。但在未來,當我們可以使用量子計算時,你不應該低估我們在更深入、更好的尺度上預測這些事情的能力。這些都具有深遠的實際意義。有些事情,比如AlphaFold所做的,你還能做些什么來理解自然,模擬自然,所有這些都有實際應用。然後,無論是通過AI還是量子,我們都在更深入地了解我們所生活的宇宙的性質和結構。我認爲這給了我們最好的機會,因爲宇宙從根本上是量子的。因此,取得進展也有更深層次的影響。它不僅會改變世界,而且也有可能爲很多其他項目提供支持。我的目標是,在五年的時間框架內,我們正在商業化地應用量子來解決一些用例,然後從那裏开始,你可以進一步發展。

  問:你提到明年AI搜索將是一件更大的事情。AI Overview(AI概述)對於我的許多搜索已經變得非常有用。你能更詳細地說明一下嗎?

  皮查伊:我們對AI Overviews搜索的發展感到非常興奮。我一直在使用Gemini 2.0 flash的AI概述,我已經看到了它的改進。這是我們將向更多人推廣的東西。但我們也會用它做更多的事情。我們的AI模型將幫助我們進行搜索,爲更復雜、更深入的查詢構建體驗,在這些查詢中,你必須對其進行分解,幫助用戶迭代,並獲得更深入的答案。2025年,我們肯定會迅速創新,搜索將做2024年無法做到的事情。這就是我爲團隊設定的目標:2025年搜索的一類問題比2024年明顯改善,我認爲我們會實現這一目標。這很令人興奮,因爲這意味着你正在推動知識和信息的前沿。我期待着所有這些都能交到用戶手中。

  問:AI安全是很多人提出的另一個問題。Demis說,也許一年前,隨着競爭的升溫,最大的風險之一是你开始從安全工作中拿走資源(弱化安全),因爲你需要盡可能多的資源來贏得這場比賽。是這樣嗎,或者你能具體談談有多少人在從事安全工作,或者有多少計算資源嗎?有辦法衡量這一點嗎?

  皮查伊:我們一直認爲,這是一個推動創新的領域,但幫助你推動進步的是從一开始就納入安全。我認爲,能夠長期思考和長期投資的優勢之一是,我們正在對這些模型的基礎安全性進行盡可能多的投資。這就是爲什么,例如,構建它的合成、开源方面,這些都是我們推動安全邊界的方式。隨着我們使這些模型更具代理性,我們都在投資安全框架。但我認爲安全和創新是齊頭並進的。正是這一點幫助我們在Waymo取得了更大的進步。因爲從第一天起,我們就將安全深深地融入了我們的創新和發展實踐中,它們是相輔相成的。同樣,在AI領域,我們有比以前更多的人從事AI安全工作,包括訪問更多的計算。這是我們始終要堅持的事情。

  問:關於反壟斷的一個問題很有趣。當我在Chrome上演示Mariner時,這就是美國政府想要迫使谷歌分拆的地方。如果你看看政府的任命,看起來這種情況不會消失。我只想問,沒有Chrome,谷歌會是什么樣子?

  皮查伊:這是一個重要的過程,我們將建設性地參與其中。我確實認爲法官承認我們一直在創新,我們打造了最好的產品。我認爲一些補救措施的範圍很廣。我們計劃提出強有力的理由。你剛剛看到了創新的出現。所有這些都有利於消費者,歸根結底,這必須是基礎。這就是我們的法律所依據的。只要我們繼續堅持這種方法,爲我們的用戶帶來有益的東西,我認爲我們最終會做得很好。

  問:你之前談到了地熱。我只是想知道在這方面是否有什么讓你興奮的事情,什么類型的能量會推動這一點?這會帶來新的可再生能源創新嗎?

  皮查伊:我們對太陽能的潛力知之甚少。有更多的機會擴大太陽能。從物理學和工程學的角度來看,我們有很多選擇。核能已經得到證實,有些國家已經證明了這一點,而且它今天仍然有效。我認爲有更安全的選擇正在不斷研究中。地球內部也有如此多的能量。我們只生活在地球表面,地球內部也有大量的能量,我們幾乎沒有利用。我一直覺得,如果你下定決心,我們應該處理能源過剩的問題。能源應該是一種催化劑,而不是一種約束。阻礙我們前進的只有我們的想象力和結果。

  問:我在看一張地熱潛在地點的地圖,它很大,覆蓋了整個美國西部。你們有一個(用地熱爲數據中心供電),但它仍然很小,還不是千兆瓦,而是兆瓦。你們必須要深入挖掘嗎?

  皮查伊:對能源的需求如此之大,我認爲我們能夠滿足它。但我們需要更多的研發資金。我們需要更適當的許可才能真正开展這些工作。我認爲這是新政府真正有機會的領域。他們已經表示,他們致力於實現這一目標。這是我們都可以取得很大進步的事情。

海量資訊、精准解讀,盡在新浪財經APP

責任編輯:劉明亮



標題:谷歌CEO最新訪談:AI要打持久战 量子計算突破令人興奮

地址:https://www.utechfun.com/post/454518.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡