谷歌DeepMind表示,它已在解決復雜數學題的方面取得了長足進展。
7月25日,谷歌推出了專門從事數學推理的AlphaProof模型,以及今年早些時候首次推出的幾何模型的升級版AlphaGeometry 2。谷歌在一篇博文中說,這些程序攻克了國際數學奧林匹克競賽(International Mathematical Olympiad)六道難題中的四道。
在AI領域,產品之間進行比較非常困難,解數學題已成爲關鍵的證據點。這是因爲在大量書面文本基礎上訓練出來的大語言模型往往偏重於語言智能而非數學智能。雖然計算機擅長數字和傳統計算,但基於文字的數學問題卻超出了這些標准,需要更復雜的推理能力。
這就是谷歌研究人員認爲其人工智能在著名數學競賽中的表現意義重大的原因。“這是機器學習和AI領域的巨大進步,谷歌DeepMind負責AI科學研究的副總裁普什米特·科利(Pushmeet Kohli)在新聞發布會上說,“目前還沒有开發出能以這種成功率解題的系統。”
雖然AI工具在自然聊天或生成圖像方面正日漸嫺熟,但它們在處理需要規劃或需要多個步驟才能解決的問題時往往舉步維艱。但谷歌及其競爭對手並沒有放棄。據報道,該公司最大的競爭對手OpenAI也一直在研究新的推理技術。
谷歌稱,AlphaProof是由擅長國際象棋、將棋和圍棋等復雜策略遊戲的谷歌AI程序演化而來的。2016年,DeepMind的一個程序擊敗了世界頂流圍棋選手,由此而名聲大噪。
大語言模型容易產生幻覺,或以令人信服的方式提供錯誤信息。谷歌表示,它利用AI將數學題翻譯成技術語句,即所謂的 “形式語言”,從而避开了這一挑战。
數學領域的AI系統面臨的另一個問題是缺乏可用的訓練數據,而聊天機器人則不同,它可以從網上的大量文本中收集信息。該公司稱,隨着谷歌的AlphaProof模型成功解題,其代碼也會隨之更新,使其能夠應對更多挑战。
該公司還發布了AlphaGeometry人工智能模型的改進版,稱其能夠解开國際數學奧林匹克競賽過去25年所有幾何題中的83%。
但谷歌研究人員同時指出,人工智能的解題能力遠不能取代人類數學家。“谷歌 DeepMind負責強化學習的副總裁戴維·西爾弗(David Silver)說:“即使我們把雄心壯志拉滿,我認爲我們的目標也是提供一個可以證明任何事情的系統。但這卻不是數學家工作的目標。”
西爾弗說,DeepMind的AI模型更像是計算尺或計算器:強大的計算工具,也許有朝一日能幫人類進行數學證明。但AI系統缺乏的是想象力。他說:“數學家提出的問題都很有趣。”
海量資訊、精准解讀,盡在新浪財經APP責任編輯:劉明亮
標題:谷歌DeepMind稱其AI工具可解奧數競賽題
地址:https://www.utechfun.com/post/402973.html