改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用

ID：20598212

大小：3.17 MB

頁數(shù)：74頁

時(shí)間：2018-10-14

資源描述：

《改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用》由會(huì)員上傳分享，免費(fèi)在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論計(jì)算能力足夠強(qiáng)，同時(shí)人們對神經(jīng)細(xì)胞與大腦的結(jié)構(gòu)與法則有足夠的了解。目前，人們可以從簡單做起，從模仿簡單的生命開始，從多智能體‘121的研究，動(dòng)物行為學(xué)的研究開始。1．2本文主要思想本論文的主要成果是隨機(jī)優(yōu)化算法的收斂性的探究，隨機(jī)優(yōu)化學(xué)習(xí)算法的構(gòu)架，以及隨機(jī)優(yōu)化算法的初步應(yīng)用。本文的主要思想源于對智能的思考與實(shí)踐。源于對動(dòng)物學(xué)習(xí)的思考與群學(xué)習(xí)的思考。從本質(zhì)上說，本文的思想源于對自然的模擬。憑空構(gòu)建智能算法是不現(xiàn)實(shí)的。本文也是建立在對前人成果的整理與思考上。如牛頓所說，我們“站在巨人的肩膀上”。對自然進(jìn)行模擬的算法與思想有很多，本文的幾個(gè)成果，

2、基于強(qiáng)化學(xué)習(xí)的控制問題與隨機(jī)優(yōu)化算法【131的構(gòu)架主要依托于強(qiáng)化學(xué)習(xí)思想㈣與隨機(jī)優(yōu)化算法的思想。而隨機(jī)優(yōu)化算法的收斂性的探究則源于隨機(jī)優(yōu)化算法的思考?？梢哉f，強(qiáng)化學(xué)習(xí)思想與隨機(jī)優(yōu)化算法的思想是貫穿本文的兩大脈絡(luò)，是本文的基礎(chǔ)。隨機(jī)性是自然的一大特征，它真正為人類所認(rèn)識(shí)，主要?dú)w功于數(shù)學(xué)家柯爾莫哥洛夫【15】。他于1933年，在《概率論的基本概念》一文中，提出并建立了概率論的公理化方法，這之后，人們可以用數(shù)學(xué)方法研究隨機(jī)性，通過隨機(jī)變量的概率密度分布函數(shù)，人們便可以研究隨機(jī)現(xiàn)象的全部統(tǒng)計(jì)特征。1．2．1隨機(jī)優(yōu)化算法的簡介隨機(jī)優(yōu)化算法是這樣一類算法：設(shè)計(jì)算法時(shí)，不需要了解待求解優(yōu)

3、化問題的數(shù)學(xué)模型，通過啟發(fā)、探索、隨機(jī)變異等迭代運(yùn)算尋找優(yōu)化問題的解。當(dāng)然，與傳統(tǒng)優(yōu)化算法[13,161不同，隨機(jī)優(yōu)化算法不能保證精確得到最優(yōu)解，這是因?yàn)殡S機(jī)優(yōu)化算法是模型無關(guān)的算法。但是隨機(jī)優(yōu)化算法可以在有限時(shí)問內(nèi)求解到最優(yōu)解的近似解，只要時(shí)間允許，可以以任意精度逼近最優(yōu)解。這是計(jì)算機(jī)時(shí)代求解數(shù)2萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論學(xué)問題的典型特征。因?yàn)樵陔x散化的世界內(nèi)，精確解是不切實(shí)際的夢想。隨機(jī)優(yōu)化算法通常是對自然界中某些原理的模擬，作為計(jì)算智能【171的一部分，它具備計(jì)算智能的三個(gè)特征。(1)算法中引入隨機(jī)因素，具有不確定性，甚至同時(shí)支持相互矛盾的途徑去求解，不少計(jì)算過

4、程實(shí)質(zhì)為隨機(jī)過程的模擬。(2)算法針對通用的一般目標(biāo)而設(shè)計(jì)，它們不采用具體問題具體分析的方法，而是采用啟發(fā)式方法。(3)算法在簡單問題求解中通常顯得很笨，在處理復(fù)雜問題時(shí)，則可以顯示優(yōu)越性。隨機(jī)優(yōu)化算法的廣義數(shù)學(xué)模型pD-VE181：待求解函數(shù)為氕的：R”oR，SER”，烀伍^X2,’‘：列鯫”，其中，搜索空間為S。求：maxflX)，s．t．XES隨機(jī)優(yōu)化算法的迭代過程描述如下：(1)初始化，隨機(jī)初始化”個(gè)解xj∈S，k=0，i=1，2,---,n。(2)從已有的“‘中隨機(jī)產(chǎn)生善。。(3)設(shè)霹“=D(F，善‘)，再選擇段+l，令k=k+l，返回(2)迭代。其中，D是迭代函

5、數(shù)，Ⅳ‘(爿)=P(X‘∈Axo，X1，?，X卜1)，且A是S的任意Borel子集。依據(jù)上述過程迭代的算法就是隨機(jī)優(yōu)化算法。流程圖如圖1．1所示。萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論㈢土在給定的范圍內(nèi)初始化肝解t蜀，尼?，列，k：。L土刪?砰?，妒邙產(chǎn)生vk1r依據(jù)已有的∥‘隨機(jī)產(chǎn)生f‘1r妒LD‘必．乏‘)l凈除1確定最優(yōu)解’廠結(jié)束、＼／圖1-1隨機(jī)優(yōu)化算法流程圖4萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論典型的隨機(jī)優(yōu)化算法包括粒子群算法，遺傳算法，模擬退火算法，蟻群算法，人工魚群算法等等。隨機(jī)優(yōu)化算法應(yīng)用于諸多領(lǐng)域，應(yīng)該說，通過運(yùn)算來提供決策的領(lǐng)域，優(yōu)化算法均有用武之地，如教育、醫(yī)療

6、、金融、交通等領(lǐng)域。從大的方面講，可以為經(jīng)濟(jì)、政策制定提供決策依據(jù)；從小的方面講，可以為專業(yè)領(lǐng)域諸如電機(jī)控制，地質(zhì)分析提供幫助。1．2．2強(qiáng)化學(xué)習(xí)思想簡介強(qiáng)化學(xué)習(xí)作為連接主義的學(xué)習(xí)方法，是一種無監(jiān)督學(xué)習(xí)，不依賴于環(huán)境模型，通過對環(huán)境的試探和環(huán)境的反饋，自適應(yīng)地建立起狀態(tài)空間與動(dòng)作空間的映射。強(qiáng)化學(xué)習(xí)的思想源于動(dòng)物學(xué)習(xí)。能感知環(huán)境的自治agent在試錯(cuò)實(shí)驗(yàn)或與環(huán)境的互動(dòng)中取得經(jīng)驗(yàn)，學(xué)習(xí)到取得所需目標(biāo)的最優(yōu)動(dòng)作。當(dāng)agent在環(huán)境中做出每個(gè)動(dòng)作時(shí)，施教者會(huì)根據(jù)環(huán)境的反饋賦予每個(gè)動(dòng)作相應(yīng)的獎(jiǎng)勵(lì)或懲罰信息。agent怎樣在與環(huán)境的交互中學(xué)到好的控制策略，是強(qiáng)化學(xué)習(xí)的核心。強(qiáng)化學(xué)習(xí)與

7、動(dòng)態(tài)規(guī)劃算法有關(guān)，動(dòng)態(tài)規(guī)劃常被用于解決最優(yōu)化問題。強(qiáng)化學(xué)習(xí)算法的主要思路如下：強(qiáng)化學(xué)習(xí)的目標(biāo)是找到控制策略萬：S吲。在給定狀態(tài)集合S中的S時(shí)，映射輸出動(dòng)作集合爿中的a。(1)探索：agent通過<最口>狀態(tài)動(dòng)作對的值，在給定輸入狀態(tài)S時(shí)，選擇輸出a。(2)回報(bào)：agent的<只d>狀態(tài)動(dòng)作對的值有環(huán)境的反饋信息做出更新。返回(1)迭代。依據(jù)上述思路進(jìn)行學(xué)習(xí)的算法稱為強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)思想如下圖l一2所示。萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論圖1．2強(qiáng)化學(xué)習(xí)的思想的基本模型可以看到，強(qiáng)化學(xué)習(xí)是一類算法的總稱。強(qiáng)化學(xué)習(xí)算法

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 74



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件，查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容，確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載，若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤，付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。

改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用

改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用

相關(guān)文章

相關(guān)標(biāo)簽