人妻少妇中文乱码在线|国产高清无码视频专区|亚洲欧美日产综合在线看|欧美亚洲国产怡红院影院|高清精品一区二区三区av|国产精品观看无码不卡视频|亚洲欧美日韩精品久久亚洲区|久久亚洲精品成人无码网站夜色

正在閱讀:柯潔別做夢(mèng)了!人類(lèi)再進(jìn)化5000年也干不過(guò)AlphaGo

柯潔別做夢(mèng)了!人類(lèi)再進(jìn)化5000年也干不過(guò)AlphaGo

2016-03-13 18:14 未知 admin

 

柯潔別做夢(mèng)了!人類(lèi)再進(jìn)化5000年也干不過(guò)AlphaGo

 

 

騰訊科技精選優(yōu)質(zhì)自媒體文章,文中所述為作者獨(dú)立觀點(diǎn),不代表騰訊科技立場(chǎng)。

文/藍(lán)馨晴(微信公眾號(hào):極客視界)

這是一場(chǎng)毫無(wú)意義的比賽,因?yàn)閯儇?fù)早已注定。李世石贏不了,就算贏一場(chǎng)也是僥幸,柯杰來(lái)了也沒(méi)用,吳清源復(fù)活也沒(méi)用。

如果你對(duì) AlphaGo 或者如今的 AI 發(fā)展稍微有點(diǎn)了解的話,你就會(huì)明白為什么人類(lèi)下不贏電腦,就算再進(jìn)化 5000 年也沒(méi)用。

先來(lái)解釋一下阿爾法狗是怎么下棋的。

圍棋有 361 個(gè)格子,理論上講,黑子的第一步有 361 種選擇,然后白子有 360 種應(yīng)對(duì),然后黑子 359 ,以此類(lèi)推。每一步棋最終可能會(huì)導(dǎo)致各種各樣的結(jié)果,如果你能窮盡所有結(jié)果,看看其中有多少是獲勝的,有多少是失敗的,就可以計(jì)算出這步棋有多大的可能性讓你贏。每次輪到你下棋時(shí),都選擇贏面最大的那一步棋,最終你就是獨(dú)孤求敗,永遠(yuǎn)都不會(huì)輸了。這就是從深藍(lán)到阿爾法狗都會(huì)使用的「蒙特卡羅樹(shù)」搜索方法。

人工智能又一次挑戰(zhàn)世界冠軍,人腦還能堅(jiān)持多久?

當(dāng)然,這只是理論上的,因?yàn)楦F盡所有是不可能的。經(jīng)過(guò)估算,圍棋的全部可能性為 10^170 種,全宇宙的原子數(shù)量加起來(lái)才 10^80,阿爾法狗還沒(méi)流弊到能計(jì)算全宇宙的原子。既然不能窮盡,就只能拿有限數(shù)量的棋局來(lái)進(jìn)行估算,這就組成了阿爾法狗的核心部分:「Policy Network」,稱(chēng)為策略網(wǎng)絡(luò)。從 5000 年前中國(guó)人發(fā)明圍棋開(kāi)始算起,全人類(lèi)下過(guò)的棋局可能也不過(guò)幾十萬(wàn)局到幾百萬(wàn)局,有大量的變化和局面還未有人嘗試,這顯然不能滿足阿爾法狗的胃口。于是它發(fā)明了一種制造棋局的方法:自己跟自己下。據(jù)說(shuō)它的「快速走子」2 微秒可以下一步棋,1秒鐘已經(jīng)下完了幾千盤(pán)棋局了。它在和李世石比賽之前已經(jīng)儲(chǔ)備了 3000 萬(wàn)個(gè)棋局,這里面有多少對(duì)局可能是人類(lèi)再下 5000 年棋也創(chuàng)造不出來(lái)的。

如果光是這樣,那也還做不到獨(dú)孤求敗,畢竟和電腦相比人類(lèi)還有「棋感」、「經(jīng)驗(yàn)」、「靈光一現(xiàn)」這類(lèi)無(wú)法量化的東西。圍棋號(hào)稱(chēng)「千古無(wú)同局」,經(jīng)常會(huì)出現(xiàn)一步棋讓盤(pán)面發(fā)生翻天覆地的變化,就像天龍八部里的珍瓏棋局所描述的那樣。為了防止人類(lèi)通過(guò)奇招、怪招打敗阿爾法狗,它還有另外一套計(jì)算方法:「Value Network」稱(chēng)為估值網(wǎng)絡(luò)。它從儲(chǔ)備的 3000 萬(wàn)個(gè)棋局(按1秒鐘下幾千盤(pán)棋局來(lái)算,現(xiàn)在估計(jì)又增加了很多)里提取了 3000 萬(wàn)個(gè)局面,然后通過(guò)『蒙特卡羅樹(shù)』的推演來(lái)評(píng)估局面的變化,一來(lái)可以砍掉大量不值得分析的分叉提高計(jì)算效率,另外更重要的是可以推演出與之相關(guān)可能出現(xiàn)的新局面。將可能產(chǎn)生的有利或不利局面倒推回來(lái),堵住一切人類(lèi)有可能出奇制勝可能性,而選擇自己更容易下出「珍瓏棋局」的局面。比如通過(guò)算棋得出下一步走 A 位可繼續(xù)保持優(yōu)勢(shì),但評(píng)估局勢(shì)認(rèn)為 B 位有可能改變整個(gè)局勢(shì),那么就會(huì)選擇B位。大家看直播,也發(fā)現(xiàn)阿爾法狗經(jīng)常這么做??刂谱×司置嬉簿突究刂屏擞捎跇颖居邢薅鴽](méi)有覆蓋到的怪招、妙招的威脅。

 

柯潔別做夢(mèng)了!人類(lèi)再進(jìn)化5000年也干不過(guò)AlphaGo

 

當(dāng)然,由于圍棋計(jì)算無(wú)法窮盡,人和機(jī)器看上去是在同一起跑線上。但阿爾法狗每1秒鐘又學(xué)習(xí)了幾千盤(pán)新棋局,其中的「珍瓏棋局」大多都是人類(lèi)聞所未聞的,這簡(jiǎn)直就是降維攻擊。人類(lèi)還是洗洗睡吧。

這場(chǎng)比賽讓我想起了百年前英國(guó)人讓馬車(chē)與火車(chē)進(jìn)行比賽,剛開(kāi)始火車(chē)還輸了呢!這些比賽都沒(méi)有意義,因?yàn)橛?jì)算機(jī)程序?qū)⒉豢杀苊獾爻饺祟?lèi)。當(dāng)然有人說(shuō)電腦程序怎么進(jìn)化也寫(xiě)不出一首優(yōu)美的詩(shī),機(jī)器無(wú)法理解人類(lèi)的喜怒哀樂(lè)。這是當(dāng)然的,但是計(jì)算機(jī)技術(shù)悄然地改變著人類(lèi)的生活,并在某些方面超越我們,但最終它們還是要為我們所用。

 

柯潔別做夢(mèng)了!人類(lèi)再進(jìn)化5000年也干不過(guò)AlphaGo

 

至于計(jì)算機(jī)會(huì)對(duì)圍棋界產(chǎn)生什么樣的影響?看看現(xiàn)在國(guó)際象棋界就知道了,有的棋手用電腦來(lái)學(xué)習(xí)和訓(xùn)練,而有的則用它來(lái)作弊。2010 年,法國(guó)大師 Sebastien Feller 在比賽中接收電腦提示而被 FIFE(國(guó)際象棋聯(lián)合會(huì))判決提前回老家。當(dāng)然,現(xiàn)在主流的做法是棋手們使用「象棋程序」來(lái)輔助訓(xùn)練,經(jīng)過(guò)電腦的計(jì)算可以排除大部分沒(méi)有意義的分支,棋手們現(xiàn)在一天可以研究的棋局可能超過(guò)過(guò)去幾十年甚至幾百年的總和。有車(chē)不坐為啥非要走路呢?我猜想未來(lái)棋類(lèi)運(yùn)動(dòng)將會(huì)朝幾個(gè)方面發(fā)展:要么完全去電腦化回歸人類(lèi)運(yùn)動(dòng)的本質(zhì),就像火箭都上天了奧運(yùn)會(huì)還有跑步一樣;要么像國(guó)際象棋那樣讓電腦來(lái)協(xié)助比賽;即使最終被「窮盡」了,回到「琴棋書(shū)畫(huà)」這類(lèi)藝術(shù)活動(dòng)的范疇也不無(wú)不可。

 

柯潔別做夢(mèng)了!人類(lèi)再進(jìn)化5000年也干不過(guò)AlphaGo

 

AlphaGo 的意義根本不在于下棋,而是計(jì)算機(jī)所進(jìn)化出的超強(qiáng)學(xué)習(xí)能力。算法的進(jìn)化可以大量節(jié)約 CPU 的計(jì)算能力,就像圍棋這樣如果真的要 「窮盡」可能要用到全宇宙的原子才行,而現(xiàn)在只需要幾千萬(wàn)盤(pán)對(duì)局就幾乎破解了這個(gè)游戲。同理像 Siri 這種語(yǔ)音助手,想要窮盡人類(lèi)所有的詞語(yǔ)表達(dá)也幾乎是不可能的,但讓計(jì)算機(jī)從有限數(shù)量的語(yǔ)言庫(kù)中學(xué)習(xí)人類(lèi)是怎么說(shuō)話的已經(jīng)變?yōu)榭赡堋?/p>

另一方面,計(jì)算機(jī)的算法依然是大數(shù)據(jù)+邏輯計(jì)算,離人類(lèi)的抽象思維、自我意識(shí)什么的還很遠(yuǎn)。它們所扮演的角色依然是作為人類(lèi)更加便捷的工具,有時(shí)候讓人變得更「懶」,有時(shí)候讓人變成「超人」。歸根結(jié)底計(jì)算機(jī)是人類(lèi)發(fā)明的,如果人類(lèi)輸?shù)袅诉@場(chǎng)比賽我們應(yīng)該歡欣鼓舞,因?yàn)槿祟?lèi)又一次戰(zhàn)勝了自己。當(dāng)然,如果未來(lái)人類(lèi)沒(méi)有利用好這個(gè)工具,并像科幻電影描述的那樣成為一種威脅,要怪也只能怪我們自己。

Geek's view

多說(shuō)兩句。之前柯潔質(zhì)疑說(shuō)李世石簽了保密協(xié)議回避打劫,我只想說(shuō)呵呵。田淵棟博士在知乎上詳細(xì)分析了阿爾法狗的原理,除了上面說(shuō)到的兩個(gè)系統(tǒng)之外,阿爾法狗還有一套快速走子程序,就是前面提到的可以 2 微秒走一步棋。打劫前后無(wú)非幾十步,加上所有可能性至多無(wú)非百千步走法,阿爾法狗不到一秒都計(jì)算好了。而且這個(gè)是運(yùn)行在本地的,不需要通過(guò)網(wǎng)絡(luò)搜索,來(lái)中國(guó)戰(zhàn)都毫無(wú)壓力。

返回資訊快報(bào)頻道 (責(zé)任編輯:城鄉(xiāng)農(nóng)科文化網(wǎng))
分享按鈕