留言討論


分享本文至 E-mail 信箱

AlphaGo 爆冷從李世乭手中拿下首勝。台灣棋王怎麼看?電腦為何辦得到?

2016 年 03 月 09 日

究竟人工智慧可以進步的多快,可在短短幾年內問鼎發展了 2500 年的圍棋世界?

Google AI 人工智慧「AlphaGo」(阿爾發哥?)對上 18 度世界圍棋冠軍的李世乭九段的第一場比賽,在今天台灣時間中午 12 點開戰,吸引上萬人在線觀看,經過約 3 小時半的激戰後,李世乭主動投降,確認無法拿下賽前設定的「五連勝」。

圖片來源:「Match 1 - Google DeepMind Challenge Match: Lee Sedol vs AlphaGo」影片截圖
圖片來源:「Match 1 – Google DeepMind Challenge Match: Lee Sedol vs AlphaGo」影片截圖

電腦與人腦的戰爭不曾停歇

1997 年,IBM 的深藍電腦 DeepBlue 擊敗西洋棋世界冠軍 Garry Kasparov 後,公認比西洋棋玩法更困難的「圍棋」,就成為人工智慧對弈軟體最想征服的新目標。目前較知名的圍棋對弈軟體包含日本的 Zen、法國的 Crazy Stone 等。

直到 2015 年 11 月,中國圍棋冠軍連笑七段都還在讓 4 、5 子的情況下,擊敗韓國的圍棋程式「石子旋風」,直到讓 6 子時才被擊敗。

然而 2016 年 1 月底《Nature》向世界投下了震撼彈,報導指出 Google 旗下「深思」(DeepMind) 開發的 AI 人工智能「AlphaGo」,以無讓子的前提下,5 : 0 完敗歐洲圍棋冠軍樊麾,讓世人震驚:「電腦已經快追來了嗎?」

當時中國論壇知乎上有匿名用戶分析

歐洲冠軍樊麾的水平目測是二段左右,而最強的 AlphaGo distributed 大概是五段,這和「擊敗人類」的目標還有距離(其他非隨機類遊戲,機器都能輕鬆擊敗最強的人類大師)。所以還是等三月和李世乭的五番棋吧。

隨後 AlphaGo 就向世界圍棋棋王,南韓的李世乭九段發出戰帖,贏者可拿到 100 萬美元的獎金,因而開啟了今日的比賽。

本次  5 場比賽都在韓國首爾四季酒店舉行,採中國圍棋競賽規則,黑貼 7.5 目,雙方各有 2 小時的佈局時間,以及 3 次 1 分鐘的讀秒,比賽全程由 YouTube 頻道直播,並邀請職業棋手雷蒙德(Michael Redmond)、劉昌赫、宋泰坤等人擔任賽局評論員。

賽前記者會上,李世乭預期自己可以拿下 5:0 或 4:1。DeepMind 則表示這段時間 AlphaGo 進步非常大,已進行 3000 萬場的自我對局,相當於人類 1000 年的學習量,好比精神時光屋。

台灣棋王怎麼看?

全程關注比賽,也在海峰棋院現場解說的台灣紅面棋王周俊勳九段接受 PanX 採訪時,表示他心情是驚訝且錯愕的。

之前看過人工智慧與歐洲圍棋冠軍的棋賽,周俊勳分析是樊麾二段太緊張失常,沒有表現出最好的一面,因此預估本次李世乭九段的贏面大,甚至有機會拿下 5 連勝。沒想到五個月後, Alphago 進步了非常多,剛剛的比賽中可以說是抓到機會就把李世石壓著打,李世乭九段近乎完敗。

他分析,和心無旁鶩的電腦相比,人類最大的挑戰,就是會受現場環境和「不能輸」等心理壓力干擾。

2009 年 10 月起,周俊勳九段與台南大學及法國巴黎第 11 大學等多所學校合作,開發「台灣魔圍棋(MoGoTW)」,當時就曾創下電腦被讓 7 子的情況,首次打敗九段棋手的紀錄。隨著這幾年不斷進步,去年已達到業餘七段(接近專業棋手)的水準。沒想到 Google 的 AlphaGo 今年一出場,就以新的計算理論震驚棋界。

AlphaGo 是如何通過計算打敗人類的?

圖片來源:Nature/Google DeepMind
1 月 28 日的《Nature》雜誌描述 AlphaGo 研究成果。圖片來源:Nature/Google DeepMind

圍棋看似規則簡單,只要在縱橫交叉的 19 條的平行線中,盡可能佔據最大的空間,一盤棋局約下 150 步,每步共有 250 種可選的下法,也因此棋路非常的多樣化。

和 IBM 的深藍電腦不同,Alpha 最大的優勢就是自我學習能力「深度學習(Deep Learning)」 能夠學習人類的下棋方式。根據果殼網作者開明的分析

AlphaGo 的核心是兩種不同的深度神經網絡。「策略網絡」(policy network)和 「值網絡」(value network)。它們的任務在於合作「挑選」出那些比較有前途的棋步,拋棄明顯的差棋,從而將計算量控制在計算機可以完成的范圍裡,本質上和人類棋手所做的一樣。

這兩個工具幫助人工智慧分析局面,判斷每一步策略的優劣,就如同人類棋手會一邊思考當下的棋盤局面,一面推測未來的發展,進而決定下一步棋路。

根據《我為什麼支持 AlphaGo》,作者提到一月發表的論文中,名列第一作者的成員之一,是來自台灣師範大學資訊工程研究所博士班畢業,也是師大圍棋社成員的黃士傑,其 2003 年和 2007 年的碩博士畢業論文都與應用於圍棋的電腦演算法有關。沒想到 2016 年的今日,人工智能已發展到程度。

接下來人腦 VS 電腦的對弈還有四場,分別為 3 月 10 日(四)、 3 月 12 日(六)、3 月 13 日(日)和 3 月 15 日(二)的台灣中午 12 點整。究竟人類能否守住這一城,讓我們一起看下去。

 

延伸閱讀:

 

第一屆台灣車客松票選活動,快來投票抽SOGO禮券等好禮!

首圖來源:Chad Miller@flickr by CC 2.0

關於作者


Valerie

PanX 編輯,興趣多多,書籍雜食者。

留言討論