OpenAI爲節約成本偷工減料？史上最強大模型GPT-4“變笨”引發全網討論，輸出質量被質疑明顯下降

2023-06-03 18:10:29 編輯： robot

導讀　　來源：每日經濟新聞　　記者/蔡鼎　　編輯/譚玉涵　　如今距離OpenAI於3月中旬推出其最新版本的大型語言模型GPT-4已經有近3個月的時間。這段時間內，盡管全球資本市場對人...

　　來源：每日經濟新聞

　　記者/蔡鼎

　　編輯/譚玉涵

　　如今距離OpenAI於3月中旬推出其最新版本的大型語言模型GPT-4已經有近3個月的時間。這段時間內，盡管全球資本市場對人工智能、大模型和算力的炒作此起彼伏，也有人稱贊GPT-4這個版本強大的能力，但卻很少有人質疑GPT-4是否真的比此前更早期的版本強大。

　　近期，網上對GPT-4是否出現退化的質疑聲开始湧現出來，越來越多的網友开始表示，GPT-4對復雜程度相似的問題處理結果甚至還不如它的前身GPT-3或GPT-3.5。面對網友的大量質疑，OpenAI官方开發者推廣大使回應稱，GPT-4處於靜止狀態，且自3月 14日發布以來沒有做過改動。

　　可能突破萬億參數的GPT-4，被OpenAI“狂吹”

　　根據OpenAI自己的說法，GPT-3擁有1750億個參數，但GPT-4的規模可能會達到數千億個參數，甚至可能會突破萬億級別。這一規模的提升將有助於提高模型的表現力和泛化能力，使其更能適應各種語言任務，同時也意味着GPT-4接受了更多的數據訓練，模型文件中有更多的權重（參數），這也使得它的運行成本更高。

　　此外，GPT-4可以更准確地解決人們的難題，多模態的GPT-4還可以生成、編輯具有創意性或技術性的文章，在高級推理方面的表現超過其前身。當然，正如大家所猜測的那樣，微軟New Bing的聊天功能確實基於GPT-4。OpenAI稱，該模型“比以往任何時候都更具創造性和協作性”，“可以更准確地解決難題”。它可以解析文本和圖像輸入，盡管它只能通過文本進行響應。

　　官方表示，GPT-4錯誤答案更少，而且也會減少偏離話題的可能，也盡可能不會再談論禁忌話題，甚至在許多標准化測試中比人類表現得都要更好一些。

　　例如，GPT-4在模擬律師考試的成績在考生中排名前10%左右，在SAT閱讀考試中排名前7%左右，在SAT數學考試中排名前11%左右。相比之下，GPT-3.5在律師考試中的得分一般都是倒數10%左右。當然，它們考個研究生還是沒問題的。

圖片來源：OpenAI

　　不少業內人士也對GPT-4的未來應用前景表示看好，稱GPT-4的出現將進一步推動AI語言模型領域的發展。作爲下一代AI語言模型，GPT-4將會在各方面都得到進一步的改善，包括語言理解、生成、多語種支持等等。同時，GPT-4也將會在各個應用場景中得到廣泛應用，爲各個行業帶來更加高效和智能的解決方案。

　　有網友4月份就對GPT-4是否退化發出質疑

　　那么，GTP-4真的如OpenAI自己所稱的那樣更強大嗎？

　　就在美東時間本周早些時候，Ycombinator上已有網友提出質疑，稱“（GPT-4）確實比以前快很多，但它的輸出質量更像是GPT-3.5++。GPT-4產生了更多的bug代碼，答案也缺乏深度和分析，總體感覺上比以前要糟糕很多。”

圖片來源：Ycombinator

　　在上述網友的帖子下方，另一名網友回復稱，“是的。在更新之前，GPT（的上一個版本）能毫不費力地解決相當復雜的編程問題，並對非編程問題給出非常微妙且像是經過深思熟慮的答案。如今，GPT-4只能修改一個10行CSS模塊中的兩行，並再次給出這修改後的10行模塊，不僅感到非常喫力，而且給出的答案中有些內容毫無關系……”

　　還有網友表示，“OpenAI的（最新）模型給我的感覺是100%被削弱了。幾個月前我用它（的早期版本）解決了非常復雜的問題（例如編寫一個最小的PDF解析器示例），但今天你會因爲問了這么復雜的任務被GPT-4‘責備’。”這名網友最後還稱，他已經決定取消訂閱他的OpenAI會員資格。

圖片來源：Ycombinator

　　在推特上，有網友稱把GPT-4的3小時25條對話額度一口氣用完了，都沒能解決自己的代碼問題，最後無奈切換回了GPT-3.5。

圖片來源：推特

　　《每日經濟新聞》記者還注意到，網上關於GPT-4是否退化的討論，其實在1個月前就已經有了。當時有網友在美國版天涯+貼吧平台Reddit上，對GPT-4是否“變笨”發出質疑。這名當時網友稱，“在過去幾天裏，我經歷了GPT-4性能的明顯下降。它的推理能力已經退化到GPT-3的水平，而且它正在努力完成上個月剛剛爲我完成的任務。今晚的性能還是最糟糕的。這是怎么回事？”

圖片來源：Reddit

　　在OpenAI的官方开發者論壇，有網友在4月30日就發帖稱，“一周前，我用GPT4爲MS飛行模擬器創建了一個非常簡單的C#應用程序。這太神奇了，我只（手動）更正了一次。今天我用了同樣的提示詞，但經過多次修改後GPT-4還是不能正常使用。”

圖片來源：OpenAI

　　一時間，關於“GPT-4退化了”、“OpenAI爲了節省成本开始偷工減料”等質疑聲开始在Ycombinator、Reddit和推特等平台快速蔓延开來。速度如此之快，就連OpenAI官方的开發者推廣大使Logan Kilpatrick都出面來公开回應網友的質疑：“API不會在沒有我們通知您的情況下更改。”

圖片來源：推特

　　在上述推文下方，Logan還回復了網友一些問題，他稱，GPT-4自從3月14日發布以來未發生改動。他還表示，GPT-4對於一些提示詞給出的回答內容不一致，是由於大模型本身不穩定。不過，針對網頁版GPT-4是否被降級過的追問，均未得到其本人的正面回答。

圖片來源：推特

　　另據監管機構NewsGuard的專家分析，OpenAI最新版本的GPT-4大型語言模型在輸出信息方面，確實比它的前身GPT-3.5還要糟糕。在今年3月份發布的報告中，NewsGuard就指出，GPT-4不僅在其研究人員的提示下回答了完全虛假的新聞敘述，而且甚至比GPT-3.5回答的內容更差。

海量資訊、精准解讀，盡在新浪財經APP

責任編輯：鄭卓

標題：OpenAI爲節約成本偷工減料？史上最強大模型GPT-4“變笨”引發全網討論，輸出質量被質疑明顯下降

地址：https://www.utechfun.com/post/221177.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤： AI GP

上一篇:中國男籃名單出人意料，如果郭艾倫趙睿集體落選，世界杯還能打嗎

下一篇:亞馬遜據稱正與美國運營商談判爲Prime用戶提供免費電話服務

您現在的位置：首頁智能設備

OpenAI爲節約成本偷工減料？史上最強大模型GPT-4“變笨”引發全網討論，輸出質量被質疑明顯下降

猜你喜歡

您現在的位置： 首頁 智能設備

猜你喜歡

您現在的位置：首頁智能設備