被 AlphaGo 擊敗的李世乭,花了八年重建崩塌的世界

2024-07-24 08:30:00    編輯: 愛範兒
導讀 「輸給 AI,我感覺整個世界都倒塌了。」李世乭最近接受《紐約時報》採訪時說。 2016年14次獲世界冠軍的韓國職業棋士代表人類出戰Google AlphaGo,最終以1:4落敗。他接受邀請時只覺得這...


「輸給 AI,我感覺整個世界都倒塌了。」李世乭最近接受《紐約時報》採訪時說。

2016年14次獲世界冠軍的韓國職業棋士代表人類出戰Google AlphaGo,最終以1:4落敗。他接受邀請時只覺得這是「好玩」的經驗:

好玩的前提是我會贏。我從未想過會輸。

那可能是AI於ChatGPT登場前最重要的時刻。現在離ChatGPT第一次發表不過兩年,已看到多領域受AI影響,生活各方面也埋下翻轉伏筆,總忍不住想推測和幻想未來的AI。比其他產業更早受AI衝擊的圍棋界,或能幫助我們看到發生過的將來。

擊敗人類後,更強AI更去「人味」

我沒有辦法再享受圍棋,所以我就退休了。

和AlphaGo對戰三年後,李世乭宣布退休。5歲開始學圍棋的李世乭,圍棋不只是競賽而是藝術,是棋士個性和風格的延伸,但AI時代卻「淪為」演算法的效率遊戲。

三年中其實還發生另一件事。

2017年,DeepMind宣布新AlphaGo:AlphaGo Zero。AlphaGo誕生自神經網路與人類三千多萬手數學習和自我練習,但AlphaGo Zero卻一開始就脫離「人味」,訓練時不接觸任何人類棋譜,單純自己和自己下棋訓練。只花三天,AlphaGo Zero迎戰AlphaGo時就以100:0獲勝。《大西洋月刊》稱之為「」。

(Source:截圖)

圍棋有種手法看起來簡單或無關緊要,但卻能造成致命威脅,有人說那就像「幽靈」。AlphaGo和AlphaGo Zero的棋譜,卻難以理解到直接視為「外星文明投射的神祕指南」。

美國職業棋手Michael Redmond於2017年,人類學圍棋重要方法是搭建故事:「那是我們溝通的方式,非常人性化。」這也許呼應李世乭的觀點,下棋時棋士展現人的那面。Redmond補充,他觀察人類棋士初見「AI味」棋路時很可能直接舉手投降:

AlphaGo下棋方式總讓人覺得「非人性」,面對這種棋局,我們很難投入。

李世乭身為最早經歷衝擊的圍棋高手,久久不能釋懷。所以他開始研究AI。退休後除了開設圍棋學院、出書和圍棋桌遊,李世乭也開始演講AI相關題目:

我算是很早面對AI,其他人之後也會經歷。但未必有開心大團圓結局。

對他來說,AI最令人擔心的地方在可能改變人類價值:

過去人們對創造力、原創性和創新充滿敬畏,但自從AI出現,這些都消失了。

但不是所有人都同意這說法。

人機共創時代

AI毀滅了圍棋圈秩序,然後重建。」康乃爾大學研究人工智慧的圍棋愛好者Jiuheng He。

許多圍棋學院,AI補助學圍棋已幾乎是所有學生都會經歷的過程。香港某圍棋學院,Ng Chee Man提供學生iPad用AI學圍棋。每次學生下棋,AI都會顯示「最佳走法」建議,系統也會記錄學生哪子下得好、哪子不好。

(Source:截圖)

去年《美國國家科學院院刊》指出,自從AI​​進入圍棋界,人類判斷能力也獲提升。早在2016年AlphaGo打敗李世乭前,不公開測試對決AlphaGo的中國棋士樊麾也有。雖然落敗,但樊麾說AlphaGo讓以他全新角度看待圍棋,提升他的技巧,使世界排名快速躍升。

則以1950~2021年棋譜為基礎,含580萬手數資料。研究員發現,AlphaGo擊敗李世乭前,人類判斷品質66年內保持平穩,但2016~2017年棋士判斷品質開始爬升。換言之,人類雖然未必能擊敗AI,但判斷能力的確有提升。

看到人類如此快速適應,將新走法融入讓人非常振奮。結果顯示,人類非常適應新發現,並在此基礎上更提升潛力。

DeepMind首席研究科學家、AlphaGo計畫負責人David Silver。AlphaGo於2017年擊敗的柯潔,2023年表示除了比賽就很少和人下棋了,認為AI已成圍棋創造力源頭:

創造性不是隨便做件不同的事,是必須投入實戰並檢驗完成,現在圍棋創新大部分是AI做的,我們想下和以前不一樣的棋,大概都會輸,因AI大量實戰有了不同思維,這才是創造力。

另一位職業棋士表現也特別引人注目。韓國棋士申真諝是首位奪得世界冠軍的00後新秀,常被棋迷稱為「申工智慧」,因他就是長時間以AI為對手訓練和研究著稱。

▲ 韓國棋手申真諝。(Source:)

2月申真諝於25屆農心盃擊敗中國主將辜負梓豪,單季六連勝,跨季16連勝,超越前輩李昌鎬。3月:

我覺得我和AI現在是朋友。

我和比我優秀的AI一起學習。AI和人類思考完全不同,AI用數學演算法解決問題,借鏡AI思路使我受益良多。

現在中日韓職業選手都會用AI訓練。

「AI味」啟示錄

正如生成式AI時代,設計師和作者需因作品可能有「AI味」而不斷自證,融入AI已久的圍棋界也面對「AI味」各種議題。現在圍棋比賽常配有AI推測勝率和AI推薦最佳走法,觀眾觀賽也能有「主動性」,有更多觀賽角度。

2022年中國棋士李軒豪對決申真諝,許多決策都與AI最優判斷前三符合,隊友楊鼎新質疑有。1995年出生的李軒豪用AI對練「朝九晚九,全年無休,確實很用功」,故棋路有時有「機器味」也不奇怪。中國圍棋協會調查後,認定指控沒有證據,處罰了楊鼎新。

但用AI作弊的確也有發生。

2020年韓國13歲職業棋士金恩持於線上比賽落子與AI推薦重疊度高達92%,調查後認定作弊(本人也承認),禁賽一年。2022年中國棋士劉睿智判定用AI作弊,是中國首次因AI作弊被處罰的職業棋士。和金恩持相比,劉睿智已懂得規避「AI味」,只是某些關鍵才用AI。各國比賽也不斷改善反AI作弊機制。

但更有人用「AI味」擊敗AI。

2023年美國業餘棋士。KataGo是現有開源最強圍棋AI之一,韓國也用來訓練棋士。Pelrine用FAR AI程式和KataGo對決超過百萬局,最後FAR AI找到KataGo的弱點,人機對決使用還獲勝:

那策略不算小兒科,但也不是特別難學。

然後,他也用同樣方法擊敗另一個厲害的圍棋AI Leela Zero。

策略關鍵在創造「大圈」圍住對手一組棋,然後突然下一子到不相關角落幹擾AI。Pelrine說,如果是人類,看到那圈就知道有問題,但AI不會知道。這弱點看起來「取巧」,是否讓AI特訓就能彌補?

《自然》報導引用預印本論文指出,面對專門找AI弱點的程式,模型漏洞並非想像容易修復。這次「針對」是KataGo,研究員用三種策略讓KataGo反擊能力更強:

  • KataGo自我對弈學習如何應付攻擊。
  • 更新訓練,以攻擊程式攻擊KataGo,漏洞回傳KataGo,再自我對弈或其他方式學習應付,然後再用攻擊程式攻擊KataGo,以此循環。
  • 從頭開始訓練新圍棋AI,採不同神經網路模型。

雖然這些訓練某種程度幫助KataGo提高防禦力,但攻擊程式依舊能發現漏洞,分別以91%、81%和78%勝率擊敗KataGo。而攻擊程式不是優秀圍棋AI,人類也能輕鬆擊敗。

當然,關鍵不是比到底人類還是AI厲害,而是圍棋這AI「顛覆過」的領域,經多年應用與改進,AI依舊有許多問題。論文作者Adam Gleave說:

如果我們對圍棋這種單一領域也沒辦法解決問題,短期想用ChatGPT等AI模型修復越獄的可能性似乎更小。

(本文由 授權轉載;首圖來源:截圖)

文章看完覺得有幫助,何不給我們一個鼓勵

想請我們喝幾杯咖啡?

每杯咖啡 65 元

x 1
x 3
x 5
x

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0


關鍵字: , , , , ,


標題:被 AlphaGo 擊敗的李世乭,花了八年重建崩塌的世界

地址:https://www.utechfun.com/post/401262.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。

猜你喜歡