您現在的位置是:首頁 > 棋牌

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式(5)

  • 由 找藉口安靜 發表于 棋牌
  • 2022-04-17
簡介大橋拓文:還有一個敏感的問題就是,我覺得“深度學習的AI中後盤比較弱”的原因,歸咎於“提供的資料本來就是不怎麼會下中後盤的,所以中後盤就變差了”

圍棋棋鍾怎麼用

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式(5)

原題:いま囲碁界で起きている“人間とAI”の関係──「中國企業2強時代」「AIに2000連敗して人類最強へと成長」將棋界とは異なるAIとの向き合いかた

摘自:文春Online

圖片:ITMedia

記者:白鳥士郎

嘉賓:大橋拓文 六段

翻譯和整理:找藉口安靜 我又把這個連載忘了

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式(5)

白鳥士郎:我們能下載簡易版的軟體嗎?

大橋拓文:不能,不過我們可以把在那個平臺上下的棋,用絕藝進行復盤。

白鳥士郎:哦哦哦!

大橋拓文:平時用用還是挺方便的,不過只用1秒鐘就會把結果從中國那邊傳過來。

白鳥士郎:這麼說算路並不深啊,這樣的話職業棋手是不是就不夠用了?

大橋拓文:是的,不過職業棋手從中獲得提示,然後用自己高效能的電腦進行驗證。當然了,他們用的就不是絕藝那樣的AI了。

白鳥士郎:絕藝下的棋,是不是很獨特呢?

大橋拓文:並非如此,在佈局上面,人類和AI感覺還是非常相似的。不過總的來說是人類棋手接近了AI,但是中盤之後AI就實在是太強了,很多地方就不是我們可以理解的了。

白鳥士郎:這和將棋界還是很相似的,不過用了深度學習技術的將棋AI,在終盤階段的計算上面有一些困難。

大橋拓文:確實如此,深度學習技術用的很多都是人類的棋感,佈局雖然很強,但是在圍棋當中最重要的後半盤就稍微有些薄弱了。但是剛剛提到的星陣,用了很多技術,所以中盤之後的實力比其他AI要強。

白鳥士郎:雖說是深度學習,但是中後盤很強,這樣豈不是無敵了?

大橋拓文:雖說都是深度學習,但是也有很多種類,星陣就是克服了這個問題,所以就達到了很難讓其他AI匹敵的高度。

相較於AlphaGo Zero完全就是透過自我學習,將人類的領域知識組合起來讓AI學習的話,或許作為圍棋AI來說更強一些。

白鳥士郎:很抱歉,領域知識是什麼?

大橋拓文:這個該怎麼說呢,雖然不是規則,但是人類在下棋的時候需要考慮的地方。還有就是還有多少手棋就能吃掉這些棋,具體來說就是徵子。

白鳥士郎:就是越下越到邊上,然後最後全部被吃的棋型嗎?

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式(5)

大橋拓文:Zero系的AI,其實是很不擅長征子的。還有就是兩眼活棋吧,這也是AlphaGo Zero沒有學過的東西。

白鳥士郎:在地盤上做出兩隻眼的話,就不會被吃掉了,這應該是圍棋的基礎中的基礎吧。

大橋拓文:所以這些東西都是透過自我學習,這就是Zero系的AI。然後Zero系也需要花費很多學習資源,所以說這些我們還是先給他們準備一下的。

白鳥士郎:不過從開發的角度出發,感覺有一些向後退的樣子。畢竟在沒有用任何人類知識的情況下,變得這麼強的。

大橋拓文:我覺得不是那樣。剛開始AlphaGo出來的時候,人類還非常絕望地覺得:“人類之前建立起來的所有東西都白費了啊”。但是AlphaGo Zero的厲害之處,就是延伸出了Alpha Star、Alpha Ford等大眾化的東西。

既然能讓專業的圍棋AI提升實力,那麼讓深度學習技術更有效率,透過人類輔助的AI,才能發展到目前的高度。

白鳥士郎:原來如此。

大橋拓文:還有一個敏感的問題就是,我覺得“深度學習的AI中後盤比較弱”的原因,歸咎於“提供的資料本來就是不怎麼會下中後盤的,所以中後盤就變差了”。

白鳥士郎:確實有道理。中後盤不太行的深度學習AI,讓他們進行自我學習的話,中後盤也就必然變差了。如果根據原來的資料學習的話,再怎麼下下去也都是差勁的。

大橋拓文:星陣和Katago,剛開始都是教他們該領域的知識之後,開始進行自我學習。而他們的中後盤,正是從實力強勁的資料中漸漸變強得來的。所以這應該就是他們強大的原因了。

而AlphaGo Zero用了實力突破了瓶頸。用了40b的大量TPU。

白鳥士郎:(又出現了我不會的術語),這個b是,數量越大就越厲害嗎?

大橋拓文:是的,這個是模擬了人類大腦的神經網路的大小。塊數越多,就越聰明。所以就覺得數字越大就越強,但是星陣的開發者好像並不認同這個觀點(笑)。

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式(5)

AI的阿喀琉斯之踵——當今圍棋界和AI的共處方式(5)

Top