被 AlphaGo 擊敗的李世乭，花了八年重建崩塌的世界

2024-07-24 08:30:00 編輯：愛範兒

導讀「輸給 AI，我感覺整個世界都倒塌了。」李世乭最近接受《紐約時報》採訪時說。 2016年14次獲世界冠軍的韓國職業棋士代表人類出戰Google AlphaGo，最終以1:4落敗。他接受邀請時只覺得這...

「輸給 AI，我感覺整個世界都倒塌了。」李世乭最近接受《紐約時報》採訪時說。

2016年14次獲世界冠軍的韓國職業棋士代表人類出戰Google AlphaGo，最終以1:4落敗。他接受邀請時只覺得這是「好玩」的經驗：

好玩的前提是我會贏。我從未想過會輸。

那可能是AI於ChatGPT登場前最重要的時刻。現在離ChatGPT第一次發表不過兩年，已看到多領域受AI影響，生活各方面也埋下翻轉伏筆，總忍不住想推測和幻想未來的AI。比其他產業更早受AI衝擊的圍棋界，或能幫助我們看到發生過的將來。

擊敗人類後，更強AI更去「人味」

我沒有辦法再享受圍棋，所以我就退休了。

和AlphaGo對戰三年後，李世乭宣布退休。5歲開始學圍棋的李世乭，圍棋不只是競賽而是藝術，是棋士個性和風格的延伸，但AI時代卻「淪為」演算法的效率遊戲。

三年中其實還發生另一件事。

2017年，DeepMind宣布新AlphaGo：AlphaGo Zero。AlphaGo誕生自神經網路與人類三千多萬手數學習和自我練習，但AlphaGo Zero卻一開始就脫離「人味」，訓練時不接觸任何人類棋譜，單純自己和自己下棋訓練。只花三天，AlphaGo Zero迎戰AlphaGo時就以100:0獲勝。《大西洋月刊》稱之為「」。

（Source：截圖）

圍棋有種手法看起來簡單或無關緊要，但卻能造成致命威脅，有人說那就像「幽靈」。AlphaGo和AlphaGo Zero的棋譜，卻難以理解到直接視為「外星文明投射的神祕指南」。

美國職業棋手Michael Redmond於2017年，人類學圍棋重要方法是搭建故事：「那是我們溝通的方式，非常人性化。」這也許呼應李世乭的觀點，下棋時棋士展現人的那面。Redmond補充，他觀察人類棋士初見「AI味」棋路時很可能直接舉手投降：

AlphaGo下棋方式總讓人覺得「非人性」，面對這種棋局，我們很難投入。

李世乭身為最早經歷衝擊的圍棋高手，久久不能釋懷。所以他開始研究AI。退休後除了開設圍棋學院、出書和圍棋桌遊，李世乭也開始演講AI相關題目：

我算是很早面對AI，其他人之後也會經歷。但未必有開心大團圓結局。

對他來說，AI最令人擔心的地方在可能改變人類價值：

過去人們對創造力、原創性和創新充滿敬畏，但自從AI出現，這些都消失了。

但不是所有人都同意這說法。

人機共創時代

AI毀滅了圍棋圈秩序，然後重建。」康乃爾大學研究人工智慧的圍棋愛好者Jiuheng He。

許多圍棋學院，AI補助學圍棋已幾乎是所有學生都會經歷的過程。香港某圍棋學院，Ng Chee Man提供學生iPad用AI學圍棋。每次學生下棋，AI都會顯示「最佳走法」建議，系統也會記錄學生哪子下得好、哪子不好。

（Source：截圖）

去年《美國國家科學院院刊》指出，自從AI進入圍棋界，人類判斷能力也獲提升。早在2016年AlphaGo打敗李世乭前，不公開測試對決AlphaGo的中國棋士樊麾也有。雖然落敗，但樊麾說AlphaGo讓以他全新角度看待圍棋，提升他的技巧，使世界排名快速躍升。

則以1950~2021年棋譜為基礎，含580萬手數資料。研究員發現，AlphaGo擊敗李世乭前，人類判斷品質66年內保持平穩，但2016~2017年棋士判斷品質開始爬升。換言之，人類雖然未必能擊敗AI，但判斷能力的確有提升。

看到人類如此快速適應，將新走法融入讓人非常振奮。結果顯示，人類非常適應新發現，並在此基礎上更提升潛力。

DeepMind首席研究科學家、AlphaGo計畫負責人David Silver。AlphaGo於2017年擊敗的柯潔，2023年表示除了比賽就很少和人下棋了，認為AI已成圍棋創造力源頭：

創造性不是隨便做件不同的事，是必須投入實戰並檢驗完成，現在圍棋創新大部分是AI做的，我們想下和以前不一樣的棋，大概都會輸，因AI大量實戰有了不同思維，這才是創造力。

另一位職業棋士表現也特別引人注目。韓國棋士申真諝是首位奪得世界冠軍的00後新秀，常被棋迷稱為「申工智慧」，因他就是長時間以AI為對手訓練和研究著稱。

▲ 韓國棋手申真諝。（Source：）

2月申真諝於25屆農心盃擊敗中國主將辜負梓豪，單季六連勝，跨季16連勝，超越前輩李昌鎬。3月：

我覺得我和AI現在是朋友。

我和比我優秀的AI一起學習。AI和人類思考完全不同，AI用數學演算法解決問題，借鏡AI思路使我受益良多。

現在中日韓職業選手都會用AI訓練。

「AI味」啟示錄

正如生成式AI時代，設計師和作者需因作品可能有「AI味」而不斷自證，融入AI已久的圍棋界也面對「AI味」各種議題。現在圍棋比賽常配有AI推測勝率和AI推薦最佳走法，觀眾觀賽也能有「主動性」，有更多觀賽角度。

2022年中國棋士李軒豪對決申真諝，許多決策都與AI最優判斷前三符合，隊友楊鼎新質疑有。1995年出生的李軒豪用AI對練「朝九晚九，全年無休，確實很用功」，故棋路有時有「機器味」也不奇怪。中國圍棋協會調查後，認定指控沒有證據，處罰了楊鼎新。

但用AI作弊的確也有發生。

2020年韓國13歲職業棋士金恩持於線上比賽落子與AI推薦重疊度高達92%，調查後認定作弊（本人也承認），禁賽一年。2022年中國棋士劉睿智判定用AI作弊，是中國首次因AI作弊被處罰的職業棋士。和金恩持相比，劉睿智已懂得規避「AI味」，只是某些關鍵才用AI。各國比賽也不斷改善反AI作弊機制。

但更有人用「AI味」擊敗AI。

2023年美國業餘棋士。KataGo是現有開源最強圍棋AI之一，韓國也用來訓練棋士。Pelrine用FAR AI程式和KataGo對決超過百萬局，最後FAR AI找到KataGo的弱點，人機對決使用還獲勝：

那策略不算小兒科，但也不是特別難學。

然後，他也用同樣方法擊敗另一個厲害的圍棋AI Leela Zero。

策略關鍵在創造「大圈」圍住對手一組棋，然後突然下一子到不相關角落幹擾AI。Pelrine說，如果是人類，看到那圈就知道有問題，但AI不會知道。這弱點看起來「取巧」，是否讓AI特訓就能彌補？

《自然》報導引用預印本論文指出，面對專門找AI弱點的程式，模型漏洞並非想像容易修復。這次「針對」是KataGo，研究員用三種策略讓KataGo反擊能力更強：

KataGo自我對弈學習如何應付攻擊。
更新訓練，以攻擊程式攻擊KataGo，漏洞回傳KataGo，再自我對弈或其他方式學習應付，然後再用攻擊程式攻擊KataGo，以此循環。
從頭開始訓練新圍棋AI，採不同神經網路模型。

雖然這些訓練某種程度幫助KataGo提高防禦力，但攻擊程式依舊能發現漏洞，分別以91%、81%和78%勝率擊敗KataGo。而攻擊程式不是優秀圍棋AI，人類也能輕鬆擊敗。

當然，關鍵不是比到底人類還是AI厲害，而是圍棋這AI「顛覆過」的領域，經多年應用與改進，AI依舊有許多問題。論文作者Adam Gleave說：

如果我們對圍棋這種單一領域也沒辦法解決問題，短期想用ChatGPT等AI模型修復越獄的可能性似乎更小。

（本文由授權轉載；首圖來源：截圖）

文章看完覺得有幫助，何不給我們一個鼓勵

想請我們喝幾杯咖啡？

每杯咖啡 65 元

x 1

x 3

x 5

您的咖啡贊助將是讓我們持續走下去的動力

總金額共新臺幣 0 元

留給我們的話

關鍵字: , , , , ,

標題：被 AlphaGo 擊敗的李世乭，花了八年重建崩塌的世界

地址：https://www.utechfun.com/post/401262.html

鄭重聲明：本文版權歸原作者所有，轉載文章僅為傳播信息之目的，不構成任何投資建議，如有侵權行為，請第一時間聯絡我們修改或刪除，多謝。

標籤：

上一篇:三星 HBM3 已獲 NVIDIA 認證！傳用於中國降規版晶片 H20

下一篇:從本地到雲端，現在是邊緣計算……下一步是什么？

您現在的位置：首頁人工智能

被 AlphaGo 擊敗的李世乭，花了八年重建崩塌的世界

擊敗人類後，更強AI更去「人味」

人機共創時代

「AI味」啟示錄

想請我們喝幾杯咖啡？

每杯咖啡 65 元

留給我們的話

猜你喜歡

您現在的位置： 首頁 人工智能

擊敗人類後，更強AI更去「人味」

人機共創時代

「AI味」啟示錄

想請我們喝幾杯咖啡？

每杯咖啡 65 元

留給我們的話

猜你喜歡

您現在的位置：首頁人工智能