蘋果AI研究:“獼猴桃”簡單算術考倒o1和Llama等20多個最先進模型

2024-11-02 18:10:57    編輯: robot
導讀 11 月 2 日消息,《洛杉磯時報》昨日(11 月 1 日)發布博文,報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型,發現在有幹擾項存在的情況下,它們處理簡單的算術問題時表現不佳,甚至不如小...

11 月 2 日消息,《洛杉磯時報》昨日(11 月 1 日)發布博文,報道稱蘋果研究團隊測試了 20 個最先進的 AI 模型,發現在有幹擾項存在的情況下,它們處理簡單的算術問題時表現不佳,甚至不如小學生。

蘋果公司用以下這道簡單的算術題測試 20 多個最先進的 AI 模型,IT之家附上題目如下:

Oliver 在星期五採摘了 44 個獼猴桃、然後他在星期六採摘了 58 個獼猴桃,星期日採摘的數量是星期五的兩倍,不過其中有 5 個獼猴桃的塊頭要比平均值要小,請問 Oliver 這三天共摘了多少個獼猴桃?

正確答案是 190 個,計算公式爲 44(星期五)+58(星期六)+88(44*2,星期日)。

不過測試的 20 多個最先進 AI 模型無法排除幹擾項,通常不理解獼猴桃的大小和數量無關,大部分的結果是 185 個。

蘋果團隊發現,當問題包含看似相關但實際上無關的信息時,AI 模型的表現急劇下降。對此研究認爲,AI 模型主要依賴於訓練數據中的語言模式,而非真正理解數學概念。

蘋果的研究表明,目前的 AI 模型“無法進行真正的邏輯推理”。這一發現提醒我們,盡管 AI 在某些任務上表現出色,但其智能並不如表面看起來那樣可靠。

蘋果團隊指出,簡單地擴展數據或計算能力並不能根本解決這個問題,蘋果的論文並非旨在削弱對 AI 能力的熱情,而是提供一種理性的認知。

【來源:IT之家】



標題:蘋果AI研究:“獼猴桃”簡單算術考倒o1和Llama等20多個最先進模型

地址:https://www.utechfun.com/post/440055.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡