改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用

改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用

ID:20598212

大小:3.17 MB

頁數(shù):74頁

時(shí)間:2018-10-14

改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用_第1頁
改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用_第2頁
改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用_第3頁
改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用_第4頁
改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用_第5頁
資源描述:

《改進(jìn)的隨機(jī)優(yōu)化算法及應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論計(jì)算能力足夠強(qiáng),同時(shí)人們對神經(jīng)細(xì)胞與大腦的結(jié)構(gòu)與法則有足夠的了解。目前,人們可以從簡單做起,從模仿簡單的生命開始,從多智能體‘121的研究,動(dòng)物行為學(xué)的研究開始。1.2本文主要思想本論文的主要成果是隨機(jī)優(yōu)化算法的收斂性的探究,隨機(jī)優(yōu)化學(xué)習(xí)算法的構(gòu)架,以及隨機(jī)優(yōu)化算法的初步應(yīng)用。本文的主要思想源于對智能的思考與實(shí)踐。源于對動(dòng)物學(xué)習(xí)的思考與群學(xué)習(xí)的思考。從本質(zhì)上說,本文的思想源于對自然的模擬。憑空構(gòu)建智能算法是不現(xiàn)實(shí)的。本文也是建立在對前人成果的整理與思考上。如牛頓所說,我們“站在巨人的肩膀上”。對自然進(jìn)行模擬的算法與思想有很多,本文的幾個(gè)成果,

2、基于強(qiáng)化學(xué)習(xí)的控制問題與隨機(jī)優(yōu)化算法【131的構(gòu)架主要依托于強(qiáng)化學(xué)習(xí)思想㈣與隨機(jī)優(yōu)化算法的思想。而隨機(jī)優(yōu)化算法的收斂性的探究則源于隨機(jī)優(yōu)化算法的思考??梢哉f,強(qiáng)化學(xué)習(xí)思想與隨機(jī)優(yōu)化算法的思想是貫穿本文的兩大脈絡(luò),是本文的基礎(chǔ)。隨機(jī)性是自然的一大特征,它真正為人類所認(rèn)識(shí),主要?dú)w功于數(shù)學(xué)家柯爾莫哥洛夫【15】。他于1933年,在《概率論的基本概念》一文中,提出并建立了概率論的公理化方法,這之后,人們可以用數(shù)學(xué)方法研究隨機(jī)性,通過隨機(jī)變量的概率密度分布函數(shù),人們便可以研究隨機(jī)現(xiàn)象的全部統(tǒng)計(jì)特征。1.2.1隨機(jī)優(yōu)化算法的簡介隨機(jī)優(yōu)化算法是這樣一類算法:設(shè)計(jì)算法時(shí),不需要了解待求解優(yōu)

3、化問題的數(shù)學(xué)模型,通過啟發(fā)、探索、隨機(jī)變異等迭代運(yùn)算尋找優(yōu)化問題的解。當(dāng)然,與傳統(tǒng)優(yōu)化算法[13,161不同,隨機(jī)優(yōu)化算法不能保證精確得到最優(yōu)解,這是因?yàn)殡S機(jī)優(yōu)化算法是模型無關(guān)的算法。但是隨機(jī)優(yōu)化算法可以在有限時(shí)問內(nèi)求解到最優(yōu)解的近似解,只要時(shí)間允許,可以以任意精度逼近最優(yōu)解。這是計(jì)算機(jī)時(shí)代求解數(shù)2萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論學(xué)問題的典型特征。因?yàn)樵陔x散化的世界內(nèi),精確解是不切實(shí)際的夢想。隨機(jī)優(yōu)化算法通常是對自然界中某些原理的模擬,作為計(jì)算智能【171的一部分,它具備計(jì)算智能的三個(gè)特征。(1)算法中引入隨機(jī)因素,具有不確定性,甚至同時(shí)支持相互矛盾的途徑去求解,不少計(jì)算過

4、程實(shí)質(zhì)為隨機(jī)過程的模擬。(2)算法針對通用的一般目標(biāo)而設(shè)計(jì),它們不采用具體問題具體分析的方法,而是采用啟發(fā)式方法。(3)算法在簡單問題求解中通常顯得很笨,在處理復(fù)雜問題時(shí),則可以顯示優(yōu)越性。隨機(jī)優(yōu)化算法的廣義數(shù)學(xué)模型pD-VE181:待求解函數(shù)為氕的:R”oR,SER”,烀伍^X2,’‘:列鯫”,其中,搜索空間為S。求:maxflX),s.t.XES隨機(jī)優(yōu)化算法的迭代過程描述如下:(1)初始化,隨機(jī)初始化”個(gè)解xj∈S,k=0,i=1,2,---,n。(2)從已有的“‘中隨機(jī)產(chǎn)生善。。(3)設(shè)霹“=D(F,善‘),再選擇段+l,令k=k+l,返回(2)迭代。其中,D是迭代函

5、數(shù),Ⅳ‘(爿)=P(X‘∈Axo,X1,?,X卜1),且A是S的任意Borel子集。依據(jù)上述過程迭代的算法就是隨機(jī)優(yōu)化算法。流程圖如圖1.1所示。萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論㈢土在給定的范圍內(nèi)初始化肝解t蜀,尼?,列,k:。L土刪?砰?,妒邙產(chǎn)生vk1r依據(jù)已有的∥‘隨機(jī)產(chǎn)生f‘1r妒LD‘必.乏‘)l凈除1確定最優(yōu)解’廠結(jié)束、\/圖1-1隨機(jī)優(yōu)化算法流程圖4萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論典型的隨機(jī)優(yōu)化算法包括粒子群算法,遺傳算法,模擬退火算法,蟻群算法,人工魚群算法等等。隨機(jī)優(yōu)化算法應(yīng)用于諸多領(lǐng)域,應(yīng)該說,通過運(yùn)算來提供決策的領(lǐng)域,優(yōu)化算法均有用武之地,如教育、醫(yī)療

6、、金融、交通等領(lǐng)域。從大的方面講,可以為經(jīng)濟(jì)、政策制定提供決策依據(jù);從小的方面講,可以為專業(yè)領(lǐng)域諸如電機(jī)控制,地質(zhì)分析提供幫助。1.2.2強(qiáng)化學(xué)習(xí)思想簡介強(qiáng)化學(xué)習(xí)作為連接主義的學(xué)習(xí)方法,是一種無監(jiān)督學(xué)習(xí),不依賴于環(huán)境模型,通過對環(huán)境的試探和環(huán)境的反饋,自適應(yīng)地建立起狀態(tài)空間與動(dòng)作空間的映射。強(qiáng)化學(xué)習(xí)的思想源于動(dòng)物學(xué)習(xí)。能感知環(huán)境的自治agent在試錯(cuò)實(shí)驗(yàn)或與環(huán)境的互動(dòng)中取得經(jīng)驗(yàn),學(xué)習(xí)到取得所需目標(biāo)的最優(yōu)動(dòng)作。當(dāng)agent在環(huán)境中做出每個(gè)動(dòng)作時(shí),施教者會(huì)根據(jù)環(huán)境的反饋賦予每個(gè)動(dòng)作相應(yīng)的獎(jiǎng)勵(lì)或懲罰信息。agent怎樣在與環(huán)境的交互中學(xué)到好的控制策略,是強(qiáng)化學(xué)習(xí)的核心。強(qiáng)化學(xué)習(xí)與

7、動(dòng)態(tài)規(guī)劃算法有關(guān),動(dòng)態(tài)規(guī)劃常被用于解決最優(yōu)化問題。強(qiáng)化學(xué)習(xí)算法的主要思路如下:強(qiáng)化學(xué)習(xí)的目標(biāo)是找到控制策略萬:S吲。在給定狀態(tài)集合S中的S時(shí),映射輸出動(dòng)作集合爿中的a。(1)探索:agent通過<最口>狀態(tài)動(dòng)作對的值,在給定輸入狀態(tài)S時(shí),選擇輸出a。(2)回報(bào):agent的<只d>狀態(tài)動(dòng)作對的值有環(huán)境的反饋信息做出更新。返回(1)迭代。依據(jù)上述思路進(jìn)行學(xué)習(xí)的算法稱為強(qiáng)化學(xué)習(xí)。強(qiáng)化學(xué)習(xí)思想如下圖l一2所示。萬方數(shù)據(jù)浙江大學(xué)碩士學(xué)位論文緒論圖1.2強(qiáng)化學(xué)習(xí)的思想的基本模型可以看到,強(qiáng)化學(xué)習(xí)是一類算法的總稱。強(qiáng)化學(xué)習(xí)算法

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。