資源描述:
《基于遺傳算法的pid參數(shù)優(yōu)化設(shè)計(jì)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、基于結(jié)構(gòu)化工作流網(wǎng)的隱含任務(wù)挖掘方法[摘要]過(guò)程挖掘是一種客觀、自動(dòng)化的過(guò)程分析技術(shù),它通過(guò)挖掘過(guò)程日志來(lái)得到業(yè)務(wù)過(guò)程的結(jié)構(gòu)模型,是傳統(tǒng)過(guò)程分析手段的重要補(bǔ)充。如何正確挖掘包含隱含任務(wù)的不完整過(guò)程日志,是過(guò)程挖掘需要解決的難題之一?,F(xiàn)有的一些算法如基因算法、α#算法等解決了部分類型隱含任務(wù)的挖掘問(wèn)題,但仍有許多類型的隱含任務(wù)無(wú)法被正確挖掘。針對(duì)這一問(wèn)題,本文在α#算法的基礎(chǔ)上提出了一種基于結(jié)構(gòu)化工作流網(wǎng)的挖掘算法,該算法能夠較為完整地挖掘各類包含隱含任務(wù)的結(jié)構(gòu)化工作流網(wǎng)模型。通過(guò)理論分析和實(shí)驗(yàn)驗(yàn)
2、證,該算法的正確性和有效性得到了證明。[關(guān)鍵詞]過(guò)程挖掘;結(jié)構(gòu)化工作流網(wǎng);隱含任務(wù);改進(jìn)α算法doi:10.3969/j.issn.1673-0194.2012.07.025[中圖分類號(hào)]tp391[文獻(xiàn)標(biāo)識(shí)碼]a[文章編號(hào)]1673-0194(2012)07-0048-040引言面對(duì)激烈的市場(chǎng)競(jìng)爭(zhēng)和市場(chǎng)環(huán)境的快速變化,現(xiàn)代企業(yè)必須能夠隨時(shí)對(duì)核心業(yè)務(wù)過(guò)程做出適當(dāng)?shù)恼{(diào)整以適應(yīng)新的需要。這不但需要管理者能夠掌握外部環(huán)境的變化,也需要管理者能夠?qū)ζ髽I(yè)業(yè)務(wù)過(guò)程的實(shí)際情況有清晰的了解。傳統(tǒng)的過(guò)程分析手段,
3、如調(diào)查、訪談、建模分析和模擬等,費(fèi)時(shí)費(fèi)力,而且受用戶的主觀性影響很大,容易出現(xiàn)偏差,因此越來(lái)越難以滿足用戶的需要。過(guò)程挖掘是一種自動(dòng)化的過(guò)程分析技術(shù),通過(guò)對(duì)業(yè)務(wù)過(guò)程日志的挖掘,自動(dòng)生成業(yè)務(wù)過(guò)程的執(zhí)行流模型,從而幫助用戶更好地理解業(yè)務(wù)過(guò)程的內(nèi)在執(zhí)行邏輯[1]。由于其分析的依據(jù)——業(yè)務(wù)過(guò)程日志是企業(yè)在實(shí)際業(yè)務(wù)運(yùn)行過(guò)程中生成的客觀記錄,因此該技術(shù)客觀性強(qiáng)、費(fèi)用低、速度快,有效地彌補(bǔ)了傳統(tǒng)過(guò)程分析手段的各種缺陷,并已經(jīng)在政府公共工程、醫(yī)院和供應(yīng)鏈管理等實(shí)際領(lǐng)域中取得了一定的成功應(yīng)用[2-4]。對(duì)包含錯(cuò)誤
4、、隱含任務(wù)[5]等的不完整日志的挖掘是過(guò)程挖掘面臨的難題之一。因?yàn)閷?shí)際中用于挖掘的日志主要來(lái)源于企業(yè)的信息系統(tǒng)的自動(dòng)生成,因此日志中包含錯(cuò)誤的情況并不常見(jiàn),不完整日志問(wèn)題基本上都是由于包含隱含任務(wù)造成的?,F(xiàn)有的大多數(shù)過(guò)程挖掘算法在處理包含隱含任務(wù)的日志時(shí)都無(wú)法得到正確的結(jié)果。少數(shù)幾種能夠處理隱含任務(wù)的算法,如基因算法[6]、α#算法[7]等,但只能挖掘部分類型的隱含任務(wù),未能完全解決隱含任務(wù)的挖掘問(wèn)題。針對(duì)這一問(wèn)題,本文嘗試提出一種基于α算法[8]和結(jié)構(gòu)化工作流網(wǎng)[9]的過(guò)程挖掘算法,該算法能夠
5、比較全面地挖掘結(jié)構(gòu)化工作流網(wǎng)模型中的各類隱含任務(wù)。通過(guò)理論分析和實(shí)驗(yàn)驗(yàn)證,該算法的正確性得到了證明。1問(wèn)題說(shuō)明過(guò)程挖掘通過(guò)對(duì)日志信息的分析來(lái)構(gòu)造過(guò)程模型。為了保證挖掘算法能夠最大限度地適用于各種形式的日志,絕大多數(shù)挖掘算法僅要求日志中包含下列3項(xiàng)內(nèi)容:①事件所屬的工作實(shí)例;②執(zhí)行事件的業(yè)務(wù)單元(任務(wù)標(biāo)識(shí));③事件發(fā)生的順序(處理時(shí)間)。因此,在分析過(guò)程挖掘算法時(shí),為了簡(jiǎn)便起見(jiàn),通常直接將日志寫(xiě)成諸如abcde,abcdf,acbde,acbdf的形式,其中每個(gè)字母代表一個(gè)任務(wù),每個(gè)逗號(hào)隔開(kāi)的字母
6、序列代表一條日志實(shí)例。對(duì)該日志實(shí)例用算法進(jìn)行過(guò)程挖掘,就可以得到如圖1(a)所示的結(jié)構(gòu)化工作流網(wǎng)過(guò)程模型。在現(xiàn)實(shí)中,由于很多信息系統(tǒng)只對(duì)進(jìn)行實(shí)際業(yè)務(wù)操作的業(yè)務(wù)單元活動(dòng)進(jìn)行記錄,以及系統(tǒng)采用的過(guò)程建模工具本身的特性等各種原因,一些過(guò)程任務(wù)往往沒(méi)有被記錄在日志中。這種過(guò)程任務(wù)就是所謂的“隱含任務(wù)”?,F(xiàn)有的大多數(shù)算法無(wú)法正確處理包含隱含任務(wù)的日志。例如,假設(shè)圖1(a)中過(guò)程的任務(wù)d是一個(gè)隱含任務(wù),則得到的日志是abce,abcf,acbe,acbf。用α算法挖掘?qū)⒌玫饺鐖D1(b)所示的模型,它不是一個(gè)
7、合法的結(jié)構(gòu)化工作流網(wǎng)模型,而且相比原始模型,其結(jié)構(gòu)復(fù)雜,不容易為用戶所理解?,F(xiàn)有少數(shù)算法能夠挖掘部分類型的隱含任務(wù),但都無(wú)法完全挖掘所有類型的隱含任務(wù)。例如,圖2給出了α#算法能夠挖掘的幾種隱含任務(wù),其中黑色方塊表示隱含任務(wù)。但它無(wú)法挖掘圖1(a)類型的隱含任務(wù)。因此,本文在綜合現(xiàn)有各種隱含任務(wù)挖掘方法的基礎(chǔ)上,結(jié)合結(jié)構(gòu)化工作流網(wǎng)本身的特性,提出了一種基于算法和結(jié)構(gòu)化工作流網(wǎng)的過(guò)程挖掘算法,該算法能夠比較全面地挖掘結(jié)構(gòu)化工作流網(wǎng)模型中的各類隱含任務(wù)。2結(jié)構(gòu)化工作流網(wǎng)中的隱含任務(wù)2.1結(jié)構(gòu)化工作流
8、網(wǎng)過(guò)程挖掘通過(guò)深入分析過(guò)程日志來(lái)構(gòu)造出過(guò)程模型。顯然,算法所使用的建模語(yǔ)言決定了算法能夠成功挖掘的過(guò)程及其日志的特性。目前,絕大多數(shù)過(guò)程挖掘算法都采用工作流網(wǎng)[10]或者其子集作為建模語(yǔ)言,它是petri網(wǎng)的一個(gè)子集,具體定義如下:定義1(工作流網(wǎng))工作流網(wǎng)n為五元組(p,t,f,i,o)。其中,p為全體庫(kù)所集合,t為全體變遷集合,f為全體邊集合,i為輸入庫(kù)所,o為輸出庫(kù)所。mo={i}為工作流網(wǎng)的初始配置。結(jié)構(gòu)化工作流網(wǎng)是工作流網(wǎng)的各類子集中研究最多最深入的一種,其特點(diǎn)是不包含非自由選擇結(jié)構(gòu),