您現在的位置是：首頁 > 棋牌

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式（5）

簡介大橋拓文：還有一個敏感的問題就是，我覺得“深度學習的AI中後盤比較弱”的原因，歸咎於“提供的資料本來就是不怎麼會下中後盤的，所以中後盤就變差了”

圍棋棋鍾怎麼用

原題：いま囲碁界で起きている“人間とAI”の関係──「中國企業2強時代」「AIに2000連敗して人類最強へと成長」將棋界とは異なるAIとの向き合いかた

摘自：文春Online

圖片：ITMedia

記者：白鳥士郎

嘉賓：大橋拓文六段

翻譯和整理：找藉口安靜我又把這個連載忘了

白鳥士郎：我們能下載簡易版的軟體嗎？

大橋拓文：不能，不過我們可以把在那個平臺上下的棋，用絕藝進行復盤。

白鳥士郎：哦哦哦！

大橋拓文：平時用用還是挺方便的，不過只用1秒鐘就會把結果從中國那邊傳過來。

白鳥士郎：這麼說算路並不深啊，這樣的話職業棋手是不是就不夠用了？

大橋拓文：是的，不過職業棋手從中獲得提示，然後用自己高效能的電腦進行驗證。當然了，他們用的就不是絕藝那樣的AI了。

白鳥士郎：絕藝下的棋，是不是很獨特呢？

大橋拓文：並非如此，在佈局上面，人類和AI感覺還是非常相似的。不過總的來說是人類棋手接近了AI，但是中盤之後AI就實在是太強了，很多地方就不是我們可以理解的了。

白鳥士郎：這和將棋界還是很相似的，不過用了深度學習技術的將棋AI，在終盤階段的計算上面有一些困難。

大橋拓文：確實如此，深度學習技術用的很多都是人類的棋感，佈局雖然很強，但是在圍棋當中最重要的後半盤就稍微有些薄弱了。但是剛剛提到的星陣，用了很多技術，所以中盤之後的實力比其他AI要強。

白鳥士郎：雖說是深度學習，但是中後盤很強，這樣豈不是無敵了？

大橋拓文：雖說都是深度學習，但是也有很多種類，星陣就是克服了這個問題，所以就達到了很難讓其他AI匹敵的高度。

相較於AlphaGo Zero完全就是透過自我學習，將人類的領域知識組合起來讓AI學習的話，或許作為圍棋AI來說更強一些。

白鳥士郎：很抱歉，領域知識是什麼？

大橋拓文：這個該怎麼說呢，雖然不是規則，但是人類在下棋的時候需要考慮的地方。還有就是還有多少手棋就能吃掉這些棋，具體來說就是徵子。

白鳥士郎：就是越下越到邊上，然後最後全部被吃的棋型嗎？

大橋拓文：Zero系的AI，其實是很不擅長征子的。還有就是兩眼活棋吧，這也是AlphaGo Zero沒有學過的東西。

白鳥士郎：在地盤上做出兩隻眼的話，就不會被吃掉了，這應該是圍棋的基礎中的基礎吧。

大橋拓文：所以這些東西都是透過自我學習，這就是Zero系的AI。然後Zero系也需要花費很多學習資源，所以說這些我們還是先給他們準備一下的。

白鳥士郎：不過從開發的角度出發，感覺有一些向後退的樣子。畢竟在沒有用任何人類知識的情況下，變得這麼強的。

大橋拓文：我覺得不是那樣。剛開始AlphaGo出來的時候，人類還非常絕望地覺得：“人類之前建立起來的所有東西都白費了啊”。但是AlphaGo Zero的厲害之處，就是延伸出了Alpha Star、Alpha Ford等大眾化的東西。

既然能讓專業的圍棋AI提升實力，那麼讓深度學習技術更有效率，透過人類輔助的AI，才能發展到目前的高度。

白鳥士郎：原來如此。

大橋拓文：還有一個敏感的問題就是，我覺得“深度學習的AI中後盤比較弱”的原因，歸咎於“提供的資料本來就是不怎麼會下中後盤的，所以中後盤就變差了”。

白鳥士郎：確實有道理。中後盤不太行的深度學習AI，讓他們進行自我學習的話，中後盤也就必然變差了。如果根據原來的資料學習的話，再怎麼下下去也都是差勁的。

大橋拓文：星陣和Katago，剛開始都是教他們該領域的知識之後，開始進行自我學習。而他們的中後盤，正是從實力強勁的資料中漸漸變強得來的。所以這應該就是他們強大的原因了。

而AlphaGo Zero用了實力突破了瓶頸。用了40b的大量TPU。

白鳥士郎：（又出現了我不會的術語），這個b是，數量越大就越厲害嗎？

大橋拓文：是的，這個是模擬了人類大腦的神經網路的大小。塊數越多，就越聰明。所以就覺得數字越大就越強，但是星陣的開發者好像並不認同這個觀點（笑）。