你的位置:首頁(yè)問(wèn)題答疑軟件答疑 → 谷歌alphago是什么

谷歌alphago是什么

來(lái)源:本站整理時(shí)間:2016/3/11 11:21:28作者:GML點(diǎn)擊: 0 評(píng)論:0

文章標(biāo)簽: 谷歌alphago

谷歌alphago最近相信已經(jīng)被身邊的朋友和網(wǎng)絡(luò)給刷屏了,在兩次圍棋大戰(zhàn)中幾乎到達(dá)了頂峰,但是仍舊有不少親們相信并不是很清楚這個(gè)是什么意思?下面小編就為大家簡(jiǎn)單的帶來(lái)相關(guān)說(shuō)明吧!

李世石比賽輸了,人工智能逆襲了?人類(lèi)真的敗給人工智能了嗎?

接下來(lái),就讓我們了解一下,這個(gè)逆天的谷歌人工智能AlphaGo到底是為何物?

1936年,艾倫·圖靈提出了一種可以輔助數(shù)學(xué)研究的機(jī)器(后來(lái)被稱(chēng)為“圖靈機(jī)”),80年過(guò)去了,人類(lèi)在人工智能領(lǐng)域已經(jīng)取得突飛猛進(jìn)的發(fā)展。上世紀(jì)90年代,IBM超級(jí)計(jì)算機(jī)“深藍(lán)”擊敗國(guó)際象棋世界冠軍,引發(fā)了“電腦是否超越人腦”的熱議。然而,圍棋因其變化莫測(cè)的招式成為了AI(Artificial Intelligence,人工智能)難以攻克的“禁地”。當(dāng)然,這個(gè)世界總有“不信邪”的人。DeepMind開(kāi)發(fā)的AI程序AlphaGo,擊敗了歐洲圍棋冠軍樊麾。

AlphaGo是什么來(lái)歷?

起初,DeepMind是英國(guó)的一家小型人工智能公司,專(zhuān)精于深度學(xué)習(xí)和分析建模領(lǐng)域,在2014年被谷歌收購(gòu)。這家公司的創(chuàng)始人名叫德米斯·哈薩比斯(Demis Hassabis),他擁有劍橋大學(xué)和倫敦大學(xué)學(xué)院的計(jì)算機(jī)科學(xué)和認(rèn)知神經(jīng)科學(xué)學(xué)位,還是一位國(guó)際象棋大師。從外表上來(lái)看,“學(xué)生氣”的哈薩比斯很普通,但是其對(duì)AI的見(jiàn)解和愿景改變了很多的看法,其中就包括著名物理學(xué)家史蒂芬·霍金。一直以來(lái),霍金總是傾向于“AI威脅論”,認(rèn)為智能機(jī)器終有一天會(huì)威脅人類(lèi)的安全。不過(guò)在與哈薩比斯長(zhǎng)談了4個(gè)小時(shí)之后,霍金似乎轉(zhuǎn)變了態(tài)度。

介紹完DeepMind的負(fù)責(zé)人,我們把目光轉(zhuǎn)回到AlphaGo。事實(shí)上,AlphaGo成名已久,曾經(jīng)先后與Crazy Stone和Zen(兩款知名圍棋程序)進(jìn)行了500局對(duì)弈,僅有一局失利。此外,其也優(yōu)于圍棋程序Dark Forest,后者得到了馬克·扎克伯格的支持。AlphaGo具備策略網(wǎng)絡(luò)(Policy Network)和估值網(wǎng)絡(luò)(Value Network)能力,前者分析局面、預(yù)測(cè)對(duì)手招式,后者負(fù)責(zé)判斷勝率,可以在2微秒內(nèi)走出一步棋,而Dark Forest僅具備第一種能力,并且走棋所花費(fèi)的時(shí)間也要更慢。

當(dāng)然,真正讓AlphaGo成名的還是戰(zhàn)勝歐洲圍棋冠軍樊麾,這在當(dāng)時(shí)引起了軒然大波,甚至推升了谷歌的股價(jià),畢竟這是電腦對(duì)人腦的一次勝利。更重要的是,站在計(jì)算機(jī)的角度來(lái)看,與象棋相比,圍棋的難度要大很多,每個(gè)步數(shù)的潛在組合非常復(fù)雜,曾有專(zhuān)家說(shuō)AI十年內(nèi)都無(wú)法掌握圍棋。

阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序,由位于英國(guó)倫敦的谷歌(Google)旗下DeepMind公司的戴維·西爾弗、艾佳·黃和戴密斯·哈薩比斯與他們的團(tuán)隊(duì)開(kāi)發(fā),這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。2015年10月阿爾法圍棋以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾;2016年3月對(duì)戰(zhàn)世界圍棋冠軍、職業(yè)九段選手李世石,李世石輸了。

阿爾法圍棋(AlphaGo)是一款圍棋人工智能程序。這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子。

深度學(xué)習(xí)

阿爾法圍棋(AlphaGo)的主要工作原理是“深度學(xué)習(xí)”!吧疃葘W(xué)習(xí)”是指多層的人工神經(jīng)網(wǎng)絡(luò)和訓(xùn)練它的方法。一層神經(jīng)網(wǎng)絡(luò)會(huì)把大量矩陣數(shù)字作為輸入,通過(guò)非線性激活方法取權(quán)重,再產(chǎn)生另一個(gè)數(shù)據(jù)集合作為輸出。這就像生物神經(jīng)大腦的工作機(jī)理一樣,通過(guò)合適的矩陣數(shù)量,多層組織鏈接一起,形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣。

兩個(gè)大腦

阿爾法圍棋(AlphaGo)是通過(guò)兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”合作來(lái)改進(jìn)下棋。這些大腦是多層神經(jīng)網(wǎng)絡(luò)跟那些Google圖片搜索引擎識(shí)別圖片在結(jié)構(gòu)上是相似的。它們從多層啟發(fā)式二維過(guò)濾器開(kāi)始,去處理圍棋棋盤(pán)的定位,就像圖片分類(lèi)器網(wǎng)絡(luò)處理圖片一樣。經(jīng)過(guò)過(guò)濾,13 個(gè)完全連接的神經(jīng)網(wǎng)絡(luò)層產(chǎn)生對(duì)它們看到的局面判斷。這些層能夠做分類(lèi)和邏輯推理。

這些網(wǎng)絡(luò)通過(guò)反復(fù)訓(xùn)練來(lái)檢查結(jié)果,再去校對(duì)調(diào)整參數(shù),去讓下次執(zhí)行更好。這個(gè)處理器有大量的隨機(jī)性元素,所以人們是不可能精確知道網(wǎng)絡(luò)是如何“思考”的,但更多的訓(xùn)練后能讓它進(jìn)化到更好。

第一大腦:落子選擇器 (Move Picker)

阿爾法圍棋(AlphaGo)的第一個(gè)神經(jīng)網(wǎng)絡(luò)大腦是“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)(Policy Network)” ,觀察棋盤(pán)布局企圖找到最佳的下一步。事實(shí)上,它預(yù)測(cè)每一個(gè)合法下一步的最佳概率,那么最前面猜測(cè)的就是那個(gè)概率最高的。這可以理解成“落子選擇器”。

第二大腦:棋局評(píng)估器 (Position Evaluator)

阿爾法圍棋(AlphaGo)的第二個(gè)大腦相對(duì)于落子選擇器是回答另一個(gè)問(wèn)題。不是去猜測(cè)具體下一步,它預(yù)測(cè)每一個(gè)棋手贏棋的可能,在給定棋子位置情況下。這“局面評(píng)估器”就是“價(jià)值網(wǎng)絡(luò)(Value Network)”,通過(guò)整體局面判斷來(lái)輔助落子選擇器。這個(gè)判斷僅僅是大概的,但對(duì)于閱讀速度提高很有幫助。通過(guò)分類(lèi)潛在的未來(lái)局面的“好”與“壞”,AlphaGo能夠決定是否通過(guò)特殊變種去深入閱讀。如果局面評(píng)估器說(shuō)這個(gè)特殊變種不行,那么AI就跳過(guò)閱讀在這一條線上的任何更多落子。

那么,匯集了AlphaGo背后“最強(qiáng)大腦”的谷歌DeepMind究竟是一個(gè)什么樣的存在?

打開(kāi)DeepMind的官網(wǎng),“破解智能,用它來(lái)讓世界變得更好”的口號(hào)赫然映入眼簾。官網(wǎng)介紹稱(chēng),DeepMind是由哈薩比斯(Demis Hassabis)、雷格(Shane Legg)與蘇萊曼(Mustafa Suleyman)三人于2010年在倫敦創(chuàng)立的。

搜索一下資料我們可以發(fā)現(xiàn),在這三人中,哈薩比斯是英國(guó)著名人工智能研究者,同時(shí)也是神經(jīng)系統(tǒng)科學(xué)家、電腦游戲設(shè)計(jì)師與世界級(jí)的游戲選手,從小就有“神童”稱(chēng)號(hào)。雷格專(zhuān)注于機(jī)器學(xué)習(xí)領(lǐng)域,擁有人工智能領(lǐng)域的博士學(xué)位。蘇萊曼則是一名英國(guó)企業(yè)家,除了幫助創(chuàng)立DeepMind,他還參與創(chuàng)立了一家專(zhuān)門(mén)研究社會(huì)問(wèn)題、提供“沖突解決方案”的公司。

2014年,DeepMind正式被谷歌納入麾下,這也是谷歌截至目前在歐洲地區(qū)的最大收購(gòu)案。據(jù)傳,在谷歌之前,包括特斯拉創(chuàng)始人馬斯克、創(chuàng)始人扎克伯格在內(nèi)的許多硅谷大佬們也都曾向DeepMind拋出過(guò)橄欖枝。可以說(shuō),雖然成立不到6年,但這家公司卻似乎沒(méi)有經(jīng)歷多少創(chuàng)業(yè)企業(yè)的艱辛,而是很早就飛上了枝頭,成為了各類(lèi)大牌科技企業(yè)、風(fēng)險(xiǎn)投資機(jī)構(gòu)眼中的“香餑餑”。

那么,拋開(kāi)一些科技企業(yè)拿人工智能炒作的嫌疑不提,DeepMind在成立的六年里又主要干過(guò)些什么? 為什么他們會(huì)具備受硅谷大佬青睞的潛質(zhì)呢?

潛質(zhì)之一,或許是這個(gè)團(tuán)隊(duì)對(duì)人工神經(jīng)網(wǎng)絡(luò)的研究。據(jù)媒體報(bào)道,早在2013年,DeepMind就創(chuàng)造出了可以模仿人類(lèi)思維、學(xué)習(xí)如何玩電子游戲的人工神經(jīng)網(wǎng)絡(luò)。當(dāng)年,DeepMind還獲得了劍橋大學(xué)計(jì)算機(jī)實(shí)驗(yàn)室的“年度公司”獎(jiǎng)項(xiàng),名聲大震。

DeepMind在人工智能、深度學(xué)習(xí)領(lǐng)域的研發(fā)實(shí)力還可以從成立以來(lái)發(fā)表的各類(lèi)學(xué)術(shù)論文中一窺。近六年來(lái),該公司不斷在包括Neuron(號(hào)稱(chēng)神經(jīng)科學(xué)界的“頂級(jí)期刊”)、Nature(全球最權(quán)威學(xué)術(shù)期刊之一)等雜志發(fā)表研究成果。尤其是在2014年被谷歌收購(gòu)后,發(fā)表的尖端研究成果數(shù)量更是與日俱增。

最后一個(gè),當(dāng)然也是最給DeepMind“長(zhǎng)臉”的就是AlphaGo。資料顯示,AlphaGo和過(guò)去挑戰(zhàn)人類(lèi)的機(jī)器們最大的區(qū)別在于,它是一款具備“深度學(xué)習(xí)”功能的機(jī)器人,也就是說(shuō)他不是為了下棋而設(shè)計(jì)的,是來(lái)“學(xué)習(xí)”下棋的,無(wú)時(shí)無(wú)刻不在模仿人類(lèi)的思維進(jìn)行學(xué)習(xí)。

那么AlphaGo究竟是怎么思考的?

AlphaGo的兩個(gè)“大腦”

資料顯示,AlphaGo下圍棋的原理和人類(lèi)有相似之處,一是判斷局部,二是把握全局。

DeepMind此前在Nature雜志發(fā)表的一篇論文中,也曾有過(guò)細(xì)節(jié)方面的介紹。簡(jiǎn)而言之就是,AlphaGo總體上由兩個(gè)不同功能的“大腦”網(wǎng)絡(luò)組成:策略網(wǎng)絡(luò)(Policy network)和價(jià)值網(wǎng)絡(luò)(Value network)。

對(duì)弈中,AlphaGo的兩個(gè)“大腦”協(xié)同工作。策略網(wǎng)絡(luò)負(fù)責(zé)在當(dāng)前局面下判斷“最好的”下一步,可以理解為落子選擇器;價(jià)值網(wǎng)絡(luò)負(fù)責(zé)評(píng)估整體盤(pán)面的優(yōu)劣,淘汰掉不值得深入計(jì)算的走法,協(xié)助前者提高運(yùn)算效率,可以理解為棋局評(píng)估器。然后,兩個(gè)“大腦”取各自選擇的平均值,做出最終的決定。

AlphaGo不斷升極的“腦力”也可以用它的戰(zhàn)績(jī)來(lái)證明。2015年,它就曾以5:0的絕對(duì)勝利打敗過(guò)歐洲圍棋冠軍樊麾,讓DeepMind由此有了向李世石“叫陣”的基礎(chǔ)。據(jù)稱(chēng),2015年那次也是人工智能程序首次在不讓子的情況下戰(zhàn)勝人類(lèi)圍棋選手。這一戰(zhàn)績(jī),加上9日首場(chǎng)比賽就戰(zhàn)勝了李世石,DeepMind對(duì)AlphaGo的信心或許還真不是空穴來(lái)風(fēng)。

那么,在發(fā)明了迄今為止“史上最強(qiáng)機(jī)器人圍棋選手”、名利雙收后,DeepMind還打算干些什么?據(jù)透露,目前DeepMind正在與英國(guó)NHS(國(guó)家醫(yī)療服務(wù)體系)進(jìn)行合作,并已經(jīng)成立了“DeepMind健康”項(xiàng)目,并希望通過(guò)技術(shù)手段,幫助有意向參與的醫(yī)護(hù)人員提高服務(wù)質(zhì)量。或許在圍棋選手后,DeepMind的下一個(gè)創(chuàng)造就是“機(jī)器人醫(yī)生”。

在AlphaGo和李世石第二局對(duì)弈的尾聲,擔(dān)任評(píng)論的國(guó)家圍棋隊(duì)總教練明明知道李世石輸了還在批評(píng)AlphaGo有俗手,聲稱(chēng)如果他來(lái)給調(diào)一下,AlphaGo會(huì)下得更好,這說(shuō)明他不光不懂人工智能,而且不懂圍棋。

先說(shuō)圍棋:圍棋如果目標(biāo)是贏,俗手不俗手就不是判斷依據(jù),以前人的算力不足,只能借助模式識(shí)別能力來(lái)做模糊判斷,但方法一模糊,判斷的標(biāo)準(zhǔn)也就模糊了,所謂是否俗手的判斷力,肯定有些對(duì)有些錯(cuò),但會(huì)有大量的僵化的錯(cuò)誤運(yùn)用,最終導(dǎo)致魚(yú)龍混雜……聽(tīng)聽(tīng),像不像是在說(shuō)中醫(yī)!

再說(shuō)人工智能:訓(xùn)練人工智能已經(jīng)越來(lái)越像培養(yǎng)孩子了,你給他準(zhǔn)備好他該上的課程(不是指死記硬背的內(nèi)容,而是循序漸進(jìn)的學(xué)習(xí)框架),再給他足夠的時(shí)間練習(xí),持之以恒,孩子的能力一定會(huì)逐漸增長(zhǎng)的。其實(shí)孩子學(xué)習(xí)不好,絕大多數(shù)不是智力問(wèn)題,而是各種原因?qū)е碌那榫w問(wèn)題。機(jī)器恰恰不存在情緒問(wèn)題,只要設(shè)計(jì)的課程體系對(duì)了(在人工智能里就是所謂神經(jīng)網(wǎng)絡(luò)),練習(xí)足夠充分(在人工智能里就是所謂深度學(xué)習(xí)),就一定能掌握好新能力。但是,長(zhǎng)輩切忌把自己以為對(duì)的方法或知識(shí)強(qiáng)灌給孩子,知識(shí)是否正確,是在系統(tǒng)引導(dǎo)下、在充分的實(shí)踐中總結(jié)出來(lái)的,越人為干涉效果越差。

圍棋這個(gè)例子說(shuō)明,人類(lèi)的能力是有局限性的,在對(duì)很多復(fù)雜事物的認(rèn)識(shí)上,人類(lèi)的知識(shí)可能根本就是不完備的,甚至有大量謬誤,圍棋只是一個(gè)簡(jiǎn)單的例子,對(duì)很多復(fù)雜系統(tǒng)的認(rèn)識(shí)都是如此,比如社會(huì),比如經(jīng)濟(jì),比如企業(yè)管理,比如中醫(yī)養(yǎng)生......

機(jī)器戰(zhàn)勝人類(lèi)選手,是圍棋歷史上的一小步,卻是人類(lèi)歷史上的一大步,尤其是AlphaGo和李世石對(duì)弈的第二局,證明了機(jī)器已經(jīng)不用靠等人類(lèi)犯錯(cuò)來(lái)取勝了,人類(lèi)不犯錯(cuò)也贏不了,說(shuō)明機(jī)器對(duì)圍棋本質(zhì)的理解超越的人類(lèi)。人類(lèi)本來(lái)就很難理解到復(fù)雜事物的本質(zhì),該是人類(lèi)在機(jī)器的幫助下更新對(duì)世間萬(wàn)事萬(wàn)物的理解的時(shí)候了。

而人工智能的優(yōu)勢(shì)在于,只要給定目的,通過(guò)自我完善,機(jī)器就能做得越來(lái)越好,最終成為真正的專(zhuān)家,聽(tīng)聽(tīng),是不是有點(diǎn)兒進(jìn)化論的味道?本來(lái)嘛,人那么萬(wàn)能的動(dòng)物,不也是進(jìn)化來(lái)的嗎!

因此,AlphaGo戰(zhàn)勝人類(lèi)頂尖圍棋選手的意義,不在于什么挑戰(zhàn)了人類(lèi)智力游戲的極限,也不在于未來(lái)會(huì)讓多少人失業(yè),不在于達(dá)到了機(jī)器超越人類(lèi)智力的奇點(diǎn),而在于它宣示著另一種奇點(diǎn)的到來(lái)--人類(lèi)可以借助非人類(lèi)的認(rèn)知能力去理解復(fù)雜事物的本質(zhì)規(guī)律了。

不過(guò)對(duì)于人這種總喜歡清楚地了解因果的動(dòng)物來(lái)說(shuō),人工智能能通過(guò)做得比我們好的結(jié)果來(lái)說(shuō)明它們掌握了復(fù)雜事物的規(guī)律,但它們卻不能清楚地詳細(xì)道出其中的因果,因?yàn)槎嘁蛩氐木C合作用,即使你能預(yù)測(cè)結(jié)果,也無(wú)法清晰地表述因果,人不行,機(jī)器也不行。

所以雖然有了個(gè)強(qiáng)力的助手,卻不能增進(jìn)我們對(duì)事物的顯現(xiàn)知識(shí)的了解,至少不是詳細(xì)的了解,但卻不妨礙我們把事情做得越來(lái)越好。當(dāng)然,這沒(méi)什么大不了的,其實(shí)我們?cè)缇蜕钤谝粋(gè)自己無(wú)法完全了解的世界里了,想想相對(duì)論,想想量子力學(xué),想想大腦的認(rèn)知結(jié)構(gòu),你真的掌握了相關(guān)的專(zhuān)業(yè)知識(shí)嗎?你確信自己不只是在重復(fù)科學(xué)家們、課本里、甚至只是媒體上的觀點(diǎn)而已嗎?多數(shù)人之所以相信相對(duì)論是正確的,并不是自己能做出清晰的證明,而只是知道愛(ài)因斯坦被公認(rèn)為20世紀(jì)最偉大的科學(xué)家,并因此對(duì)他的言論產(chǎn)生的信任甚至盲目崇拜吧。

未來(lái),AlphaGo(阿法狗)和Watson之類(lèi)的智能工具將無(wú)處不在,人類(lèi)將進(jìn)入人仗狗勢(shì)的時(shí)代。我們將能借助人工智能總統(tǒng)回避掉滿嘴跑火車(chē)的川普;我們將能借助人工智能總經(jīng)理提升公司業(yè)績(jī),甚至做到基業(yè)長(zhǎng)青;我們將能借助人工智能管家管理我們的生活,讓我們專(zhuān)注于最富創(chuàng)造力、最能彰顯人性的事情上。當(dāng)然,前提是,你不光要會(huì)利用人工智能,和人工智能親密合作,還要像信任愛(ài)因斯坦一樣信任人工智能。

這,才是真正的奇點(diǎn),人工智能的奇點(diǎn),這個(gè)奇點(diǎn)將會(huì)造成人類(lèi)能力的空前進(jìn)步,人類(lèi)創(chuàng)造力的空前釋放,人類(lèi)文明的空前繁榮。

以上,是關(guān)于阿爾法的一些簡(jiǎn)單介紹,親們可以了解一下~~!

游客評(píng)論

熱門(mén)評(píng)論

最新評(píng)論

發(fā)表評(píng)論 查看所有評(píng)論(0)

(您的評(píng)論需要經(jīng)過(guò)審核才能顯示) 字?jǐn)?shù): 0/500

本周熱門(mén)

找游戲 下應(yīng)用

排行榜

游戲軟件破解

推薦手機(jī)游戲?qū)^(qū)

關(guān)于安卓網(wǎng) | 聯(lián)系方式 | 發(fā)展歷程 | 下載幫助(?) | 廣告聯(lián)系 | 網(wǎng)站地圖 | 友情鏈接

Copyright 2011-2014 5577.com安卓網(wǎng) 鄂ICP備15005058號(hào)-1