你的位置:首頁(yè)新聞業(yè)界新聞 → 谷歌alphago和李世石的比賽棋譜分析

谷歌alphago和李世石的比賽棋譜分析

來(lái)源:本站整理時(shí)間:2016/3/11 18:10:20作者:CRL點(diǎn)擊: 0 評(píng)論:0

文章標(biāo)簽: 谷歌alphago 李世石

谷歌alphago和李世石的比賽棋譜吸引了不少的圍棋愛(ài)好者,通過(guò)觀察此次AlphaGo圍棋VS李世石的棋譜,可以看出,人工智能還是比較強(qiáng)大的,下面來(lái)一起看下谷歌alphago和李世石的比賽棋譜精彩對(duì)局吧。

比賽采用5局3勝制,最終比賽獲勝方將獲得獎(jiǎng)金100萬(wàn)美元。李世石在本輪戰(zhàn)敗后,只有剩下3局全部獲勝才能以3:2總比分戰(zhàn)勝AlphaGo,而AlphaGo下一局只需獲勝即可宣布戰(zhàn)勝李世石。

剩余賽程如下(北京時(shí)間中午12點(diǎn)開(kāi)賽):

第三場(chǎng)比賽:3月12日(周六)

第四場(chǎng)比賽:3月13日(周日)

第五場(chǎng)比賽:3月15日(周二)

終盤(pán)畫(huà)面,有網(wǎng)友說(shuō)黑棋像個(gè)“死”字

在剛剛結(jié)束的人機(jī)圍棋大戰(zhàn)中,李世石再一次輸給了谷歌的AlphaGo。目前來(lái)看,總體形勢(shì)不容樂(lè)觀,有可能李世石會(huì)連敗五局。而機(jī)智的網(wǎng)友們馬上開(kāi)始發(fā)揮P圖本領(lǐng),通過(guò)棋譜來(lái)對(duì)可憐的小李子進(jìn)行嘲諷。

▲這張圖說(shuō)AlphaGo在嘲諷小李子是一個(gè)弱雞。


▲這兩張棋譜寫(xiě)著李世石今天一定會(huì)輸,因?yàn)閷?xiě)著今天我死。

網(wǎng)友嘲諷歸嘲諷,但是李世石的實(shí)力還是毋庸置疑的。作為韓國(guó)最強(qiáng)棋手,李世石九段還是具有很大的實(shí)力的。希望小李子調(diào)整好心態(tài),勇敢地面對(duì)接下來(lái)的三場(chǎng)對(duì)AlphaGo的比賽。

AlphaGo贏了,但我找到了它的兩個(gè)“弱點(diǎn)”

谷歌人工智能(AI)程序AlphaGo圍棋逆轉(zhuǎn)戰(zhàn)敗李世乭九段的消息讓人頗為震驚,大呼“最后的驕傲”也喪失了。確實(shí),在很多事情上,人工智能都能夠代替人類來(lái)完成。但就今天這局“世紀(jì)圍棋”之戰(zhàn)來(lái)說(shuō), 勝負(fù)在棋盤(pán)之外。或者說(shuō),AlphaGo的勝利并沒(méi)有神奇到可以說(shuō)“人工智能戰(zhàn)勝人類”。

一、計(jì)算力強(qiáng)勢(shì)碾壓

在AlphaGo的系統(tǒng)上,開(kāi)發(fā)團(tuán)隊(duì)使用了更大的計(jì)算機(jī)網(wǎng)絡(luò)——包括170個(gè)GPU和1200個(gè)標(biāo)準(zhǔn)CPU。結(jié)合蒙特卡洛搜索算法,AlphaGo能夠看到的可能性走法清晰而全面,純計(jì)算的方式同時(shí)避免了失誤的可能。計(jì)算機(jī)一分鐘的計(jì)算量(實(shí)戰(zhàn)中AlphaGo前期步時(shí)約1分鐘),人腦也許需要半小時(shí)甚至更多。

而據(jù)搜狗CEO表示,如今AlphaGo的配置已有了極大的改善,其中GPU達(dá)到2000以上。也就是說(shuō),AlphaGo擁有了這個(gè)先決的優(yōu)勢(shì)條件,在走子上的表現(xiàn)也不足為奇。在Alphago之前,也已經(jīng)有多種純計(jì)算軟件戰(zhàn)勝棋力高強(qiáng)的人類選手。

從今天的對(duì)局來(lái)看,AlphaGo(執(zhí)白)非常擅長(zhǎng)近身肉搏,可見(jiàn)其局部計(jì)算之精密。

二、不懂大局謀劃,形勢(shì)判斷仍未突破

AlphaGo和李世乭今天的對(duì)局中,前期李世乭使用大規(guī)模布局的作戰(zhàn)方式,形勢(shì)上偶有領(lǐng)先。但是,形勢(shì)屬虛,在后來(lái)近身肉搏的過(guò)程中,AlphaGo比李世乭要兇猛。比如下圖,黑棋在左下方定型時(shí),白子回到上方挑事,非常頑強(qiáng),所以黑子才會(huì)被白子挖走一塊又一塊。

但是,這樣說(shuō)明計(jì)算機(jī)程序?qū)τ诓季诌沒(méi)學(xué)會(huì)。布局變數(shù)比應(yīng)著要多,形勢(shì)要虛,判斷依賴棋感。在這一點(diǎn)上,AlphaGo仍然體現(xiàn)出了電腦的弱點(diǎn)。古力九段表示,AlphaGo對(duì)厚勢(shì)(外勢(shì))的判斷沒(méi)有搞清楚。

而恰好,李世乭的強(qiáng)項(xiàng)和弱項(xiàng)都和AlphaGo的特性對(duì)上了!爸袊(guó)圍棋第一人”柯潔九段分析稱:“李世乭的強(qiáng)項(xiàng)是后半盤(pán)的翻盤(pán)能力,布局則是李世乭最差的地方,判斷力也不是太好,這對(duì)于AlphaGo來(lái)說(shuō)是個(gè)重大利好,因?yàn)橛?jì)算機(jī)一般來(lái)說(shuō)也是強(qiáng)在后半盤(pán)。”

三、AlphaGo在進(jìn)取,但更多的是反應(yīng)

到了中盤(pán),盡管黑方已經(jīng)定勢(shì),但AlphaGo非常進(jìn)取,以致黑方未能坐實(shí)優(yōu)勢(shì)。這是AlphaGo表現(xiàn)優(yōu)秀的一面。因?yàn)榘蠢碚f(shuō),要破這種形勢(shì)需要找到最優(yōu)的妙手,可見(jiàn)AlphaGo的蒙特卡洛搜索算法的準(zhǔn)確度有了極大的提高。

不過(guò), AI目前只能在特定場(chǎng)景下,遵循規(guī)則產(chǎn)生特定的結(jié)果。在此對(duì)局中,AlphaGo雖然執(zhí)白屬后手,但基本無(wú)法搶得先手,也很少能夠主導(dǎo)局面形勢(shì)的變化,更多的是順著對(duì)方走,直到對(duì)手失誤。

曹大元九段在對(duì)局結(jié)束時(shí)表示,AlphaGo的表現(xiàn)令人吃驚,但人工智能與人類本質(zhì)上還沒(méi)有分出勝負(fù)。就弈棋而言,低手比棋譜,強(qiáng)手比計(jì)算,高手比棋理。

我們不能否認(rèn)AlphaGo在人工智能上取得的突破,人工智能的復(fù)雜性和艱巨性不言而喻,它的每一小步都意味著人類科學(xué)邁出的一大步,即便它還是這么“蠢”,我們?nèi)詾樗鼩g欣鼓舞。

圖片來(lái)源:弈客直播

本人作為一名圍棋愛(ài)好者,就此發(fā)表了一些個(gè)人見(jiàn)解,不喜勿噴,也歡迎交流。

【AlphaGo分析】

AlphaGo簡(jiǎn)介

AlphaGo去年10月?lián)魯W洲冠軍

谷歌曾于2014年以4億歐元收購(gòu)人工智能公司DeepMind。由DeepMind研發(fā)的AlphaGo項(xiàng)目已有兩年歷史,AlphaGo曾在去年戰(zhàn)勝了歐洲圍棋冠軍樊麾(職業(yè)二段)。

去年10月5日-10月9日,谷歌AlphaGo在比賽中以5:0的比分完勝了歐洲冠軍。除了戰(zhàn)勝人類外,AlphaGo還與其他的圍棋程序?qū)?zhàn),獲得了500場(chǎng)勝利。

AlphaGo原理簡(jiǎn)介

傳統(tǒng)的人工智能方法是將所有可能的走法構(gòu)建成一棵搜索樹(shù) ,但這種方法對(duì)圍棋并不適用。此次谷歌推出的AlphaGo,將高級(jí)搜索樹(shù)與深度神經(jīng)網(wǎng)絡(luò)結(jié)合在一起。這些神經(jīng)網(wǎng)絡(luò)通過(guò)12個(gè)處理層傳遞對(duì)棋盤(pán)的描述,處理層則包含數(shù)百萬(wàn)個(gè)類似于神經(jīng)的連接點(diǎn)。

其中一個(gè)神經(jīng)網(wǎng)絡(luò)“決策網(wǎng)絡(luò)”(policy network)負(fù)責(zé)選擇下一步走法,另一個(gè)神經(jīng)網(wǎng)絡(luò)“值網(wǎng)絡(luò)”(“value network)則預(yù)測(cè)比賽勝利方。谷歌方面用人類圍棋高手的三千萬(wàn)步圍棋走法訓(xùn)練神經(jīng)網(wǎng)絡(luò),與此同時(shí),AlphaGo也自行研究新戰(zhàn)略,在它的神經(jīng)網(wǎng)絡(luò) 之間運(yùn)行了數(shù)千局圍棋,利用反復(fù)試驗(yàn)調(diào)整連接點(diǎn),這個(gè)流程也稱為鞏固學(xué)習(xí)(reinforcement learning)。通過(guò)廣泛使用Google云平臺(tái),完成了大量研究工作。

AlphaGo在與人的對(duì)弈中用了“兩個(gè)大腦”來(lái)解決問(wèn)題:“決策網(wǎng)絡(luò)”和“值網(wǎng)絡(luò)”。通俗來(lái)說(shuō)就是,一個(gè)大腦用來(lái)決策當(dāng)前應(yīng)該如何落子,另一個(gè)大腦來(lái)預(yù)測(cè)比賽最終的勝利方。

值得一提的是,李世石也是第一次與機(jī)器對(duì)戰(zhàn),所以他無(wú)法像和人類對(duì)戰(zhàn)那樣,先研究對(duì)方的棋譜和下棋風(fēng)格。李世石所能做的就是和自己對(duì)弈。谷歌AlphaGo也是通過(guò)這種方式鍛煉自己,真正做到了“人工智能”。

關(guān)于這盤(pán)棋,會(huì)有很多解讀。不止在今天,甚至在數(shù)十年之后,這盤(pán)棋還可能會(huì)被拿出來(lái)研究,從棋譜上,更從人機(jī)不同的思維上。不論未來(lái)回看這盤(pán)棋的是人類還是真正有了自我意識(shí)的AI,想必都會(huì)有與當(dāng)下的我們不同的感受。而我們有義務(wù)把我們的感受和思考記錄下來(lái),讓后人知道當(dāng)時(shí)的人究竟是如何理解這盤(pán)棋,他們有哪些錯(cuò)誤的認(rèn)識(shí)、可笑的想法,又有哪些深刻的洞察。

我們來(lái)看看,今天這盤(pán)棋,究竟發(fā)生了什么。這盤(pán)棋可能將是有史以來(lái)職業(yè)棋手最難以統(tǒng)一意見(jiàn)的對(duì)局,以下觀點(diǎn)是我個(gè)人見(jiàn)解,只是在圍棋AI時(shí)代毫無(wú)預(yù)兆迅猛而來(lái)時(shí),一名棋手盡可能理性的分析和思考。

一、李世石的針對(duì)性策略

從棋譜來(lái)看,我認(rèn)為李世石在這盤(pán)棋前后主要使用了一個(gè)試探,和兩個(gè)策略。

1)試探:從未出現(xiàn)過(guò)的布局

棋譜復(fù)盤(pán)人機(jī)大戰(zhàn)

李世石第7手,沒(méi)有按常規(guī)布局在上邊連片,而選擇走在右邊。李世石自己在職業(yè)比賽中從未使用過(guò)這一開(kāi)局,甚至整個(gè)職業(yè)圍棋界,沒(méi)有人見(jiàn)過(guò)這一開(kāi)局。

李世石不按常規(guī)布局,顯然是對(duì)電腦的一種試探。在去年10月AlphaGo對(duì)樊麾的五盤(pán)棋中,所有開(kāi)局都是常規(guī)布局,雖然那五盤(pán)的開(kāi)局在今天已經(jīng)不是主流,但都是曾經(jīng)流行一時(shí)的布局。

避開(kāi)流行布局,甚至避開(kāi)曾經(jīng)流行過(guò)的已經(jīng)被淘汰的布局,選擇一個(gè)從未出現(xiàn)過(guò)的布局。李世石在考驗(yàn)AlphaGo在布局階段的應(yīng)變能力。我們知道AlphaGo的深度學(xué)習(xí)基于大量已有對(duì)局的數(shù)據(jù),那么,面對(duì)一個(gè)棋譜庫(kù)里從未見(jiàn)過(guò)的布局,AlphaGo你將如何應(yīng)對(duì)?

AlphaGo給出了完美的回答。

棋譜復(fù)盤(pán)人機(jī)大戰(zhàn)

白8掛角正常,黑9二間高夾最為激烈。白10,這一手……非常出色。

通常情況下,在右上白8遭遇二間高夾的時(shí)候,白10是“不存在”的一手,它不在任何定式之中。面對(duì)黑9,白棋有諸多定式選擇,卻沒(méi)有白10這一手。

然而,我認(rèn)為白10是好手。

白10的好處在于使黑7變成效率低下的一手,雖然在右上局部白棋稍稍虧損,但加上黑7的低效,白棋一點(diǎn)也不吃虧。

AI竟然會(huì)通盤(pán)考慮!傳統(tǒng)的圍棋AI,會(huì)根據(jù)已有棋譜來(lái)走定式,定式是經(jīng)過(guò)長(zhǎng)期檢驗(yàn)的局部雙方可以接受的定型。然而定式的弊端就在于,不同的周?chē)h(huán)境,定式的適用性有所不同。從這盤(pán)棋來(lái)看,黑9夾擊之后,白棋如果選擇面對(duì)二間高夾最常用的“妖刀”定式,即走在15位,反而將使黑7的位置成為絕對(duì)的好點(diǎn),黑7的效率將會(huì)大大提升。

實(shí)戰(zhàn)白棋選擇了一個(gè)定式里沒(méi)有的、局部稍虧的、卻使得黑7這個(gè)遙遠(yuǎn)棋子的效率變低的下法,非常清楚地證明了兩點(diǎn):

電腦不依靠背譜來(lái)下棋

電腦的考慮基于全局而非局部。

當(dāng)然,第一點(diǎn)其實(shí)在對(duì)樊麾的棋譜中已經(jīng)可以看出來(lái)。在對(duì)樊麾的常規(guī)開(kāi)局中,AI出現(xiàn)了數(shù)次不同于“譜著”的下法。其中有一盤(pán)出現(xiàn)“大雪崩”定式,電腦選擇的次序是定式和棋譜里沒(méi)有的,而且是從邏輯上不如譜著的。注意,這里強(qiáng)調(diào)是邏輯上不如譜著,而不是在經(jīng)驗(yàn)上。即,AI當(dāng)時(shí)的次序是“絕對(duì)弱于”譜著,只可能虧沒(méi)可能便宜,雖然選點(diǎn)是正確的,但在我們看來(lái)是“次序錯(cuò)誤”。這體現(xiàn)出,AlphaGo不依賴于定式和譜著,但也暴露出AI在邏輯上的不足,反應(yīng)在棋盤(pán)上就可能會(huì)出現(xiàn)次序錯(cuò)誤。這一點(diǎn),也是棋手普遍不看好AI能戰(zhàn)勝李世石的一個(gè)原因。

但這一問(wèn)題在這盤(pán)棋我們并沒(méi)有看到。起碼,沒(méi)有非常明顯地顯現(xiàn)出來(lái)(后面會(huì)提到一個(gè)細(xì)微的類似問(wèn)題)。

而第二點(diǎn)則是這盤(pán)棋AI開(kāi)局給我們秀出的能力。他輕易擺脫了李世石設(shè)下的定式圈套,以全局的視野作出了定式中不存在的選擇。

如果說(shuō)第一點(diǎn)是我們?cè)贏lphaGo對(duì)樊麾時(shí)已經(jīng)能夠看到的情況,那么第二點(diǎn)則是這局棋在布局階段對(duì)人類試探的完美答復(fù)。如果只依靠大量棋譜堆砌出來(lái)的局部圖像識(shí)別,AI做不出這樣的選擇。

AlphaGo第三場(chǎng)直播地址匯總 李世石第三場(chǎng)會(huì)贏嗎 

谷歌alphago智能?chē)遘浖芟螺d嗎 AlphaGo圍棋下載地址

AlphaGo李世石人機(jī)大戰(zhàn)視頻直播地址匯總 

谷歌alphago是什么

李世石人機(jī)大戰(zhàn)第三局棋譜視頻解說(shuō)直播地址 

游客評(píng)論

熱門(mén)評(píng)論

最新評(píng)論

發(fā)表評(píng)論 查看所有評(píng)論(0)

(您的評(píng)論需要經(jīng)過(guò)審核才能顯示) 字?jǐn)?shù): 0/500

本周熱門(mén)

找游戲 下應(yīng)用

排行榜

游戲軟件破解

推薦手機(jī)游戲?qū)^(qū)

關(guān)于安卓網(wǎng) | 聯(lián)系方式 | 發(fā)展歷程 | 下載幫助(?) | 廣告聯(lián)系 | 網(wǎng)站地圖 | 友情鏈接

Copyright 2011-2014 5577.com安卓網(wǎng) 鄂ICP備15005058號(hào)-1