資源描述:
《基于仿真的優(yōu)化方法綜述》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、.基于仿真的優(yōu)化方法綜述作者:李東汪定偉1引言人們對復(fù)雜事物和復(fù)雜系統(tǒng)建立數(shù)學(xué)模型并進(jìn)行求解的能力是有限的,目標(biāo)函數(shù)和約束條件往往不能以明確的函數(shù)關(guān)系表達(dá),或因函數(shù)帶有隨機(jī)參、變量,導(dǎo)致基于數(shù)學(xué)模型的優(yōu)化方法在應(yīng)用于實(shí)際生產(chǎn)時(shí),有其局限性甚至不適用。基于仿真的優(yōu)化(SimulationBasedOptimization,SBO)方法正是在這樣的背景下發(fā)展起來的。隨著優(yōu)化問題越來越復(fù)雜,對優(yōu)化對象的評價(jià)只能通過仿真獲得的統(tǒng)計(jì)指標(biāo)來實(shí)現(xiàn)。這時(shí),SBO是復(fù)雜優(yōu)化問題的惟一選擇。近年來,SBO已成為國際上最熱的研究方向。雖然SBO已經(jīng)在很多領(lǐng)域得到了應(yīng)用,但是當(dāng)前對于SBO的理論研究并
2、不完善,算法仍在不斷探索和改進(jìn)中,新的研究成果不斷出現(xiàn)。2SBO的研究概況及分類綜觀最優(yōu)化的發(fā)展過程,大約經(jīng)過了以下幾個(gè)階段:①1940~1970年數(shù)學(xué)規(guī)劃階段一目標(biāo)和約束是解析函數(shù)。②1970-2000年智能優(yōu)化階段一目標(biāo)和約束放寬為含有判斷邏輯的計(jì)算機(jī)程序。③2000年一未來基于仿真的優(yōu)化(SBO)階段一用大量仿真的統(tǒng)計(jì)數(shù)據(jù)來進(jìn)行性能評價(jià)。有些學(xué)者對SBO做了一些綜述工作。Andradottir從連續(xù)事件和離散事件兩個(gè)方面,對SBO技術(shù)作了總結(jié);Azadivar從單目標(biāo)優(yōu)化和多目標(biāo)優(yōu)化的角度對SBO方法作了論述;在國內(nèi),楊湘龍等認(rèn)為SBO是非枚舉地從可能值中找到最佳輸入變量
3、值,使得輸出結(jié)果為最優(yōu)或滿意解的過程。王凌等按照優(yōu)化方法的不同,對SBO及其改進(jìn)和應(yīng)用作了綜述。..隨著對SBO方法研究的深入,SBO在復(fù)雜工程系統(tǒng)的設(shè)計(jì)優(yōu)化、供應(yīng)鏈和物流系統(tǒng)、制造系統(tǒng)及社會(huì)經(jīng)濟(jì)系統(tǒng)等領(lǐng)域得到了應(yīng)用??偨Y(jié)當(dāng)前的研究和應(yīng)用情況,可以看出,基于仿真的優(yōu)化是仿真方法和優(yōu)化方法的結(jié)合,是借助仿真手段實(shí)現(xiàn)系統(tǒng)的優(yōu)化的一種優(yōu)化方法。這里既強(qiáng)調(diào)了仿真與優(yōu)化是互相融合的,又強(qiáng)調(diào)了優(yōu)化是目的,仿真是手段的思想。本文基于這一思想,在計(jì)算方法上按照仿真在SBO中所起作用的不同,將SBO分為仿真用于策略驗(yàn)證;將仿真的輸出作為優(yōu)化算法中的適應(yīng)值一即仿真起到適應(yīng)值函數(shù)的作用;用仿真方法獲
4、取優(yōu)化算法中用解析方法無法得到的參數(shù)或函數(shù)這3類。以往的綜述工作,在分類時(shí)往往注重對優(yōu)化方法的闡述,而忽視了仿真在優(yōu)化中的作用,而本文的分類方式,更能體現(xiàn)SBO方法是仿真與優(yōu)化相結(jié)合的這一特點(diǎn),更加面向具體應(yīng)用。3SBO方法1)仿真用于策略驗(yàn)證在SBO中,將仿真用于策略驗(yàn)證是應(yīng)用最簡單的一種,主要適用于數(shù)學(xué)模型難以表達(dá)、解空間為一組候選的策略集,且解空間不大的問題。此類優(yōu)化的做法是將候選策略集中的策略逐一輸入仿真模型,驅(qū)動(dòng)仿真運(yùn)行,然后比較每一組輸出結(jié)果,根據(jù)輸出結(jié)果來確定最優(yōu)的策略,如圖1所示。圖1仿真用于策略驗(yàn)證流程圖Jacobs等將此類方法應(yīng)用于荷蘭航空公司航班計(jì)劃的制定
5、中,確定當(dāng)有航班因故延誤時(shí),使用何種調(diào)整策略。其目標(biāo)是追求利潤的最大。候選策略集為:S={交換兩個(gè)航班的次序,使用備用飛機(jī),縮短維護(hù)時(shí)間,取消該航班}。候選策略集中只有4種策略,逐一輸入到仿真模型中,即可比較出在不同運(yùn)營時(shí)期,選用哪種策略最好。在這個(gè)應(yīng)用中,候選策略是4個(gè)可直接操作的方案。..還有的應(yīng)用中,策略集是由一組啟發(fā)式方法構(gòu)成的,仿真用于驗(yàn)證哪種啟發(fā)式方法好。Takahama等使用基于仿真的優(yōu)化方法來確定如何為自動(dòng)化倉儲(chǔ)系統(tǒng)分配存儲(chǔ)空間,目標(biāo)是作業(yè)數(shù)量最少、運(yùn)輸距離最短、庫存費(fèi)用最低。將倉儲(chǔ)過程分為兩個(gè)階段來仿真,第1階段是倉庫收到貨物階段,其策略集由3種啟發(fā)式方法構(gòu)成
6、:Sl={隨機(jī)選擇位置存放貨物,將屬于相同顧客的貨物集中堆放,按離庫時(shí)間先后存放貨物}。第2階段是提取貨物,為了提取壓在下面的貨物,需要將上面的貨物移開,針對將上面的貨物移動(dòng)到哪個(gè)位置,其策略集由4種啟發(fā)式方法構(gòu)成:S2={移到最近的位置,移到最近且離庫時(shí)間更遲的貨物上,綜合前兩個(gè)策略但前者優(yōu)先于后者,綜合前兩個(gè)策略但后者優(yōu)先于前者}。這里的策略不是可直接操作的方案,而是指導(dǎo)作業(yè)如何進(jìn)行的規(guī)則,依據(jù)不同的規(guī)則,會(huì)得到不同的仿真結(jié)果。經(jīng)仿真驗(yàn)證,S1中的第2個(gè)策略和S2中的第2個(gè)策略組合起來是最好的。將仿真應(yīng)用于策略驗(yàn)證的方法有其局限性,它只能從候選策略集中選出最好的方案,不能主
7、動(dòng)地尋找最優(yōu)解。它實(shí)際上是通過枚舉的方法來對比每個(gè)策略的效果,當(dāng)策略數(shù)量較多或是不能顯式地表達(dá)出策略時(shí),這類方法不適用。相對來講,其他兩類方法的應(yīng)用范圍更廣。2)仿真輸出適應(yīng)值在SBO方法中,將仿真的輸出作為算法的適應(yīng)值是當(dāng)前一個(gè)研究熱點(diǎn)。這一類方法在解決適應(yīng)值函數(shù)無法表達(dá)的優(yōu)化問題時(shí)有明顯的優(yōu)越性。它是將仿真模塊嵌入到優(yōu)化算法中,將仿真模塊的輸出作為算法的適應(yīng)值,用于指導(dǎo)優(yōu)化算法搜索新的解。優(yōu)化算法產(chǎn)生的新解又作為下一次仿真的輸入,直到仿真模型的輸出滿足終止條件,如圖2所示。圖2仿真輸出作