一文看懂AI算法的秘密.doc

一文看懂AI算法的秘密.doc

ID:27820379

大?。?7.50 KB

頁(yè)數(shù):8頁(yè)

時(shí)間:2018-12-06

一文看懂AI算法的秘密.doc_第1頁(yè)
一文看懂AI算法的秘密.doc_第2頁(yè)
一文看懂AI算法的秘密.doc_第3頁(yè)
一文看懂AI算法的秘密.doc_第4頁(yè)
一文看懂AI算法的秘密.doc_第5頁(yè)
資源描述:

《一文看懂AI算法的秘密.doc》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、一文看懂AI算法的秘密一文看懂AI算法的秘密一文看懂AI算法的秘密  這篇文章的主角是AlphaGo,谷歌DeepMind團(tuán)隊(duì)開(kāi)發(fā)出的圍棋AI。其憑借著2016年擊敗全球頂尖棋手李世石的壯舉而廣受矚目。下面就隨網(wǎng)絡(luò)通信小編一起來(lái)了解一下相關(guān)內(nèi)容吧?! 迨且环N古老的棋類(lèi)游戲,每一步都存在諸多選擇,因此接下來(lái)的落子位置很參議會(huì)預(yù)測(cè)——要求對(duì)弈棋手擁有強(qiáng)大的直覺(jué)與抽象思維能力。正因?yàn)槿绱耍藗冮L(zhǎng)久以來(lái)一直認(rèn)為只有人類(lèi)擅長(zhǎng)下圍棋。大多數(shù)研究人員甚至認(rèn)定,還需要數(shù)十年才會(huì)出現(xiàn)真正具備這種思考能力的AI。但如今距離AlphaGo對(duì)李世石的比賽已經(jīng)過(guò)去了兩年(3月8日

2、至3月15日),而本篇文章正是為了紀(jì)念這個(gè)偉大的日子!  不過(guò)更可怕的是,AlphaGo并沒(méi)有停止自己的前進(jìn)腳步。8個(gè)月之后,它在某圍棋網(wǎng)站上以“Master”為名與全球各地的冠軍棋手進(jìn)行了60盤(pán)職業(yè)對(duì)弈,且拿下全勝成績(jī)?! ∵@當(dāng)然是人工智能領(lǐng)域的一項(xiàng)巨大成就,并在全球引起了一股新的討論熱潮——我們到底該對(duì)人工智能的發(fā)展速度感到興奮,還是擔(dān)心?  今天,我們將以DeepMind在《自然》雜志上發(fā)表的原始研究論文作為基礎(chǔ),逐段對(duì)其內(nèi)容進(jìn)行簡(jiǎn)單清晰的解讀,詳細(xì)介紹AlphaGo是什么以及它的工作原理。我也希望大家能夠在閱讀本文之后,不再被媒體頭條拋出的聳人聽(tīng)聞的

3、標(biāo)題所恐嚇,而真正對(duì)關(guān)于人工智能的發(fā)展感到振奮?!   ‘?dāng)然,你不需要掌握圍棋技巧,也同樣可以理解本文的觀點(diǎn)。事實(shí)上,我本人只讀過(guò)網(wǎng)絡(luò)百科上的一丁點(diǎn)圍棋說(shuō)明。相反,我其實(shí)會(huì)使用基礎(chǔ)的國(guó)際象棋示例來(lái)解釋相關(guān)算法。大家只需要了解雙人棋類(lèi)游戲的基本規(guī)則即可——每位選手輪流行動(dòng),最后將產(chǎn)生一位贏家。除此之外,你不需要了解任何物理學(xué)或高數(shù)知識(shí)?! ∵@樣盡可能降低入門(mén)門(mén)檻,是為了能讓剛剛接觸機(jī)器學(xué)習(xí)或者神經(jīng)網(wǎng)絡(luò)的朋友更容易接受。本文也刻意降低了表述復(fù)雜度,也是希望大家能把注意力盡量集中在內(nèi)容本身。  眾所周知,AlphaGo項(xiàng)目的目標(biāo)在于建立一款A(yù)I程序,并保證其能夠與

4、世界頂級(jí)人類(lèi)選手在圍棋領(lǐng)域一較高下?! 榱死斫鈬鍘?lái)的挑戰(zhàn),我們首先聊聊與之類(lèi)似的另一種棋類(lèi)運(yùn)動(dòng)——國(guó)際象棋。早在上世紀(jì)九十年代初,IBM公司出打造出深藍(lán)計(jì)算機(jī),其在國(guó)際象棋比賽中擊敗了偉大的世界冠軍加里·卡斯帕羅夫。那么,深藍(lán)是如何做到這一點(diǎn)的?  事實(shí)上,深藍(lán)使用了一種非常“暴力”的作法。在游戲的每一步,深藍(lán)都會(huì)對(duì)所有可能作出的合理棋步作出考量,并沿著每種棋步探索以分析未來(lái)的局勢(shì)變化。在這樣的前瞻性分析之下,計(jì)算結(jié)果很快形成一種千變?nèi)f化的巨大決策樹(shù)。在此之后,深藍(lán)會(huì)沿著樹(shù)狀結(jié)構(gòu)返回原點(diǎn),觀察哪些棋步最可能帶來(lái)積極的結(jié)果。然而,何謂“積極的結(jié)果”?事實(shí)

5、上,眾多優(yōu)秀的國(guó)際象棋棋手為深藍(lán)精心設(shè)計(jì)出了國(guó)際象棋策略,旨在幫助其作出更好的決策——舉例來(lái)說(shuō),是決定保護(hù)國(guó)王,還是在盤(pán)面的其它位置獲得優(yōu)勢(shì)?他們針對(duì)此類(lèi)目的構(gòu)建起特定的“評(píng)估算法”,從而比較不同盤(pán)面位置的優(yōu)勢(shì)或劣勢(shì)權(quán)重(IBM公司將專家們的象棋策略以硬編碼形式引入該評(píng)估函數(shù))。最終,深藍(lán)會(huì)據(jù)此選擇出經(jīng)過(guò)精心計(jì)算的棋步。在接下來(lái)的回合中,整個(gè)過(guò)程再次重復(fù)?! ∵@意味著,深藍(lán)在每一步之前都會(huì)考量數(shù)百萬(wàn)個(gè)理論位置。因此,深藍(lán)最令人印象深刻的表現(xiàn)并不在于人工智能軟件層面,而體現(xiàn)在其硬件之上——IBM公司宣稱,深藍(lán)是當(dāng)時(shí)市場(chǎng)上最為強(qiáng)大的計(jì)算機(jī)之一。其每秒能夠計(jì)算2億

6、個(gè)盤(pán)面位置?! ‖F(xiàn)在讓我們回到圍棋方面。圍棋顯然更為開(kāi)放,因此如果在這里重復(fù)深藍(lán)的戰(zhàn)略,將根本無(wú)法獲得理想效果。由于每個(gè)棋步都擁有過(guò)多可選擇的位置,因此計(jì)算機(jī)根本無(wú)法涵蓋這么多潛在的可能性。舉例來(lái)說(shuō),在國(guó)際象棋的開(kāi)局當(dāng)中,只有20種可能的下法;但在圍棋方面,先手選手將擁有361個(gè)可能的落子點(diǎn)——而且這種選擇范圍在整個(gè)對(duì)弈過(guò)程中一直非常廣泛?! ∵@就是所謂“巨大搜索空間”。而且在圍棋當(dāng)中,判斷某個(gè)特定盤(pán)面位置的有利或不利權(quán)重并沒(méi)那么容易——在官子階段,雙方甚至還需要再排布一陣才能最終確定誰(shuí)才是勝利者。但有沒(méi)有一種神奇的方法能夠讓計(jì)算機(jī)在圍棋領(lǐng)域有所建樹(shù)?答案是

7、肯定的,深度學(xué)習(xí)能夠完成這項(xiàng)艱巨的任務(wù)!  因此在本次研究當(dāng)中,DeepMind方面利用神經(jīng)網(wǎng)絡(luò)來(lái)完成以下兩項(xiàng)任務(wù)。他們訓(xùn)練了一套“策略神經(jīng)網(wǎng)絡(luò)(policyneuralnetwork)”以決定哪些才是特定盤(pán)面位置當(dāng)中最為明智的選項(xiàng)(這類(lèi)似于遵循某種直觀策略選擇移動(dòng)位置)。此外,他們還訓(xùn)練了一套“估值神經(jīng)網(wǎng)絡(luò)(valueneuralnetwork)”以估算特定盤(pán)面布局對(duì)選手的有利程度(或者說(shuō),下在這個(gè)位置對(duì)贏得游戲這一目標(biāo)的實(shí)際影響)。他們首先使用人類(lèi)棋譜對(duì)這些神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練(也就是最傳統(tǒng)但也非常有效的監(jiān)督式學(xué)習(xí)方法)。經(jīng)歷了這樣的訓(xùn)練,我們的人工智能已經(jīng)

8、可以在一定程度上模仿人類(lèi)的下棋方式——這時(shí)的它,就像

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。