日韩视频一区二区,国产成人久久精品麻豆二区,日韩亚洲国产欧美精品,亚洲v视频,欧美电影一区,国产午夜精品一区二区三区小说,国产在线观看一区二区三区

央廣網(wǎng)

定了!AlphaGo下月對戰(zhàn)人類棋手柯潔等

2017-04-10 14:35:00來源:環(huán)球網(wǎng)

  4月10日,谷歌在中國棋院召開發(fā)布會,宣布5月23日-27日在烏鎮(zhèn)主辦“中國烏鎮(zhèn)o圍棋峰會”,屆時AlphaGo將再度與柯潔等為代表的中國頂尖棋手進(jìn)行為期對弈。

  AlphaGo是一款圍棋人工智能程序,由谷歌旗下DeepMind公司的戴密斯o哈薩比斯、大衛(wèi)o席爾瓦、黃士杰與他們的團(tuán)隊(duì)開發(fā)?聺嵤侵袊鴩迓殬I(yè)九段棋手,他也是圍棋等級分排名世界第一。

  此次人機(jī)終極大戰(zhàn)中,代表人類出戰(zhàn)的是目前排名世界第一的職業(yè)圍棋九段選手柯潔,而代表機(jī)器一方的則是AlphaGo的2.0版本。區(qū)別于和李世石對戰(zhàn)的AlphaGo1.0,這次對戰(zhàn)柯潔的AlphaGo2.0采用了新的算法模型。此前,該版本曾化名Master,以在線對弈的形式擊敗了包括柯潔在內(nèi)的所有選手,60戰(zhàn)而無一敗。

  據(jù)Deep Mind介紹,1.0版本的AlphaGo是“深度學(xué)習(xí)”人類棋譜得出圍棋手?jǐn)?shù)的估值,AlphaGo1.0所走招法其實(shí)并沒有脫離人類的理解,而且也是人類棋手曾下過的棋。如果AlphaGo1.0完善到極致,就意味著得出了接近完美的圍棋手?jǐn)?shù)估值函數(shù)。2.0版本AlphaGo利用這個估值函數(shù)自我對局和“深度學(xué)習(xí)”,不再受人類棋譜的局限,下出真正屬于“人工智能”的圍棋。

  人機(jī)對戰(zhàn)歷史

  2016年1月,AlphaGo在沒有任何讓子的情況下,以5:0完勝歐洲圍棋冠軍、職業(yè)二段選手樊麾,計(jì)算機(jī)程序能在不讓子的情況下,在完整的圍棋競技中擊敗專業(yè)選手,這是第一次。

  2016年3月,AlphaGo與圍棋世界冠軍、職業(yè)九段選手李世石進(jìn)行人機(jī)大戰(zhàn),并以4:1的總比分獲勝。谷歌董事長施密特在該比賽的開幕儀式上稱:“無論比賽結(jié)果如何,勝者都是人類!

  2016年末2017年初,AlphaGo在中國棋類網(wǎng)站上以Master為注冊帳號與中日韓數(shù)十位圍棋高手進(jìn)行快棋對決,連續(xù)60局無一敗績。

  不少職業(yè)圍棋手認(rèn)為,AlphaGo的棋力已經(jīng)達(dá)到甚至超過圍棋職業(yè)九段水平,2016年7月18日,世界職業(yè)圍棋排名網(wǎng)站GoRatings公布最新世界排名,谷歌旗下DeepMind的人工智能系統(tǒng)AlphaGo以3612分,超越3608分的柯潔成為新的世界第一。

  2017年1月,谷歌Deep Mind公司CEO哈薩比斯在德國慕尼黑DLD(數(shù)字、生活、設(shè)計(jì))創(chuàng)新大會上宣布推出真正2.0版本的AlphaGo。其特點(diǎn)是擯棄了人類棋譜,只靠深度學(xué)習(xí)的方式成長起來挑戰(zhàn)圍棋的極限。

  AlphaGo主要由以下部分組成:走棋網(wǎng)絡(luò)(Policy Network),給定當(dāng)前局面,預(yù)測/采樣下一步的走棋;快速走子(Fast rollout),目標(biāo)和走棋網(wǎng)絡(luò)一樣,但在適當(dāng)犧牲走棋質(zhì)量的條件下,速度要比走棋網(wǎng)絡(luò)快1000倍;估值網(wǎng)絡(luò)(Value Network),給定當(dāng)前局面,估計(jì)是白勝還是黑勝;蒙特卡洛樹搜索(Monte Carlo Tree Search),把以上這三個部分連起來,形成一個完整的系統(tǒng)。

  值得注意的是,AlphaGo并不是DeepMind唯一項(xiàng)目,也不是最大的項(xiàng)目。DeepMind的最終目標(biāo)是智能助手、醫(yī)療和機(jī)器人。另外,盡管AlphaGo只是針對圍棋開發(fā)的系統(tǒng),但其原理可以被應(yīng)用到現(xiàn)實(shí)問題中。(騰訊科技 劉亞瀾 管慕飛)

編輯: 賈斯曼
關(guān)鍵詞: AlphaGo;谷歌;柯潔;對戰(zhàn);GoRatings