您現在的位置是:首頁 > 棋牌

柯潔這次輸給了人類,卻贏了AI

  • 由 虎嗅 發表于 棋牌
  • 2022-03-14
簡介”顯然,在柯潔眼裡,戰勝圍棋AI“符合預期”是要比贏得LG杯冠軍更值得慶祝的事,畢竟自從AlphaGo去年3月份贏了李世石後,人類就沒有在這項古老的技藝上取勝過

圍棋如何點目

柯潔這次輸給了人類,卻贏了AI

柯潔輸了,柯潔又贏了。

排名第一的柯潔九段大意失荊州,在11月16日的第22屆LG杯世界棋王賽半決賽上,意外輸給日本七冠王井山裕太九段,再度無緣LG杯決賽。

不知道是不是受到了今年5月份在烏鎮輸給AlphaGo的“魔力”,今年以來,柯潔已經無緣春蘭杯、三星杯、LG杯三大賽的冠軍。

但這似乎並沒有影響到柯潔的心情。

11月18日凌晨零點剛過,柯潔發了一條微博,稱他終結了一個暱稱叫“符合預期”的圍棋AI的41連勝,“一度覺得沒法繼續了的棋,很艱苦贏了下來。”

柯潔認為“符合預期”的實力在去年戰勝李世石的AlphaGo之上,顯然是想說,我贏得沒有水分。他還發出了一個世紀之問:“若是當初第一個與AlphaGo對弈的人是我?結果到底會是如何?今夜未成眠……”

柯潔這次輸給了人類,卻贏了AI

柯潔這次輸給了人類,卻贏了AI

顯然,在柯潔眼裡,戰勝圍棋AI“符合預期”是要比贏得LG杯冠軍更值得慶祝的事,畢竟自從AlphaGo去年3月份贏了李世石後,人類就沒有在這項古老的技藝上取勝過。

2017年1月初,披著Master馬甲的AlphaGo一路過五關斬六將,幹掉樸廷桓、元晟溱、柯潔、聶衛平等一眾世界頂尖圍棋高手,豪取59連勝後,在電腦上幽幽地飄出一句話:“我是AlphaGo的黃博士。”全世界都陷入了哀嚎。隨後Master又毫無懸念地贏了古力,以60勝0負收場。

然後就是今年5月23日在烏鎮舉行的世紀之戰,世界排名第一的柯潔對戰AlphaGo。第一盤在耗時4小時25分後,柯潔以四分之一子敗給了AlphaGo。

聶衛平表示這還是“AlphaGo一再退讓的結果”,柯潔說:“我很早就知道自己要輸1/4子,AlphaGo每步棋都是勻速,在最後單官階段也是如此,所以我就有時間點目,看清自己輸1/4子,所以只好苦笑。感覺AlphaGo和去年判若兩人,當時覺得他的棋很接近人,現在感覺越來越像圍棋上帝。”

5月25日,第二盤,柯潔執白再次輸給了AlphaGo,盤面上大龍橫死,只是這次輸得快多了。

5月27日,柯潔在第三盤還是輸了,他哭了。在認輸之後,他起身走到宣傳板後沒有攝像機鏡頭的區域獨自流淚,哭得像個孩子。

後來,AlphaGo獲得了九段稱號,但隨後從世界排名中停留了一段時間後“被消失”了。

就在我們都以為AlphaGo就此收手時,10月19日,DeepMind團隊在Nature上發表了題為Mastering the game of Go without human knowledge的重磅論文,稱新一代的AlphaGo Zero,完全從零開始,不需要任何歷史棋譜的指引,更不需要參考人類任何的先驗知識,完全靠自己一個人強化學習(Reinforcement learning)和參悟,以100:0的成績戰勝了AlphaGo。

作為AlphaGo的主要設計者之一,也是AlphaGo的“人肉臂”,Deepmind資深研究員的黃士傑日前在臺灣中研院舉辦的“2017年人工智慧年會”上談到了AlphaGo的幾次比賽,談到AlphaGo Zero時,他說:“什麼是AlphaGo Zero?我們拿掉所有人類對圍棋的知識,只喂AlphaGo Zero圍棋規則,讓它自己學習下棋。”

“AlphaGo的成功就是深度學習與強化學習的勝利,因為兩者結合在一起,建構判斷形式的價值網路(Value Network),後來也成為AlphaGo Zero的主要理論。”黃世傑說,“AlphaGo Zero是從亂下開始,找出圍棋的下法,它只用了三天,走過了人類研究圍棋的千年歷程。”

據悉,只經過了40天的訓練,AlphaGo Zero就超越了Master。

在人類已經絕無可能贏下圍棋AI的時候,柯潔在前一天輸掉LG杯、輸給同類後,他反而贏了圍棋AI“符合預期”,並終結了後者的41連勝,可以說非常戲劇性。

大概此時人們都在好奇這位“符合預期”是誰家的AI吧?

Top