資源描述:
《基于神經(jīng)網(wǎng)絡(luò)集成的失業(yè)預(yù)警方法》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、基于神經(jīng)網(wǎng)絡(luò)集成的失業(yè)預(yù)警方法李宏李建武宋玉龍【內(nèi)容提要】提出采用神經(jīng)網(wǎng)絡(luò)集成技術(shù)對(duì)中國(guó)失業(yè)預(yù)警系統(tǒng)進(jìn)行建模,以克服當(dāng)前失業(yè)預(yù)警系統(tǒng)建模中存在的小樣本、高維度、非線性、噪音數(shù)據(jù)等難題。采用BP神經(jīng)網(wǎng)絡(luò)回歸模型對(duì)失業(yè)率進(jìn)行預(yù)測(cè);基于兩種集成技術(shù)Bagging與AdaBoost對(duì)多個(gè)神經(jīng)網(wǎng)絡(luò)進(jìn)行集成,以獲得比單個(gè)預(yù)測(cè)模型更好的精度與穩(wěn)定性;最后基于廣東省的社會(huì)經(jīng)濟(jì)調(diào)查數(shù)據(jù)進(jìn)行了實(shí)證分析,實(shí)驗(yàn)結(jié)果表明:在對(duì)失業(yè)率的預(yù)測(cè)上,Bagging集成方法的預(yù)測(cè)效果優(yōu)于Adaboost集成方法,也優(yōu)于單個(gè)最好的神經(jīng)網(wǎng)絡(luò)模型?!娟P(guān)鍵詞】失業(yè)預(yù)警神經(jīng)網(wǎng)絡(luò)集成BaggingAdaBoost
2、失業(yè)預(yù)警系統(tǒng)是在高失業(yè)率出現(xiàn)之前,預(yù)先報(bào)警的系統(tǒng)。該項(xiàng)研究對(duì)于當(dāng)前我國(guó)構(gòu)建和諧社會(huì)具有重要意義。2008年爆發(fā)的國(guó)際金融危機(jī)對(duì)中國(guó)就業(yè)造成了巨大沖擊,更突出了失業(yè)預(yù)警系統(tǒng)研究的重要性。2008年1月1日開(kāi)始施行的《中華人民共和國(guó)就業(yè)促進(jìn)法》第四十二條明確規(guī)定:縣級(jí)以上人民政府建立失業(yè)預(yù)警制度,對(duì)可能出現(xiàn)的較大規(guī)模的失業(yè),實(shí)施預(yù)防、調(diào)節(jié)和控制。建立失業(yè)預(yù)警預(yù)案系統(tǒng),可以及時(shí)分析和預(yù)測(cè)勞動(dòng)力市場(chǎng)狀況,為政府有效控制失業(yè)率上升,彌補(bǔ)勞動(dòng)力市場(chǎng)調(diào)節(jié)功能的不足,進(jìn)行勞動(dòng)力市場(chǎng)宏觀調(diào)控提供可靠的參考依據(jù),從而有利于維護(hù)社會(huì)穩(wěn)定和經(jīng)濟(jì)的健康發(fā)展。一、失業(yè)預(yù)警研究現(xiàn)狀國(guó)外失業(yè)預(yù)警模
3、型主要建立在宏觀社會(huì)經(jīng)濟(jì)預(yù)警系統(tǒng)建模的基礎(chǔ)之上。1950年,穆?tīng)?Moore)的擴(kuò)散指數(shù)建模法和1960年希特金(Shiskin)的綜合指數(shù)建模法成為當(dāng)時(shí)美國(guó)構(gòu)造社會(huì)經(jīng)濟(jì)預(yù)警系統(tǒng)的兩大基本方法[1-3]。1982年,恩格爾(Engle)創(chuàng)造性地提出了ARCH(AutoRegressiveConditionalHeteroskedasticity)類模型[4],對(duì)預(yù)警風(fēng)險(xiǎn)的評(píng)估方法進(jìn)行了改進(jìn)。在此基礎(chǔ)上,博勒斯萊夫(Bollerslev)于1986提出了GARCH模型(GeneralizedARCH)[5]。1997年,卡明斯基(Kaminsky)等人提出了KLR信號(hào)
4、分析法[6]。1988年,本文作者李宏所在的勞動(dòng)科學(xué)研究所失業(yè)預(yù)警課題組首次倡導(dǎo)“勞動(dòng)部門應(yīng)建立包括失業(yè)預(yù)警系統(tǒng)在內(nèi)的六大勞動(dòng)預(yù)警系統(tǒng)”[7],該課題組于2001年完成了國(guó)家科委軟科學(xué)研究項(xiàng)目“我國(guó)失業(yè)預(yù)警系統(tǒng)與就業(yè)對(duì)策研究(K97—10—50)”,系統(tǒng)地建立了失業(yè)預(yù)測(cè)的“回歸模型”和“神經(jīng)網(wǎng)絡(luò)模型”,這些模型的特點(diǎn)是以失業(yè)人數(shù)或失業(yè)率作為因變量,采用了數(shù)學(xué)建模方法、大型數(shù)據(jù)庫(kù)和計(jì)算機(jī)軟件技術(shù)[8]。傳統(tǒng)的失業(yè)預(yù)警建模方法往往采用單一的預(yù)測(cè)模型,面對(duì)失業(yè)預(yù)警建模的小樣本、高維度、非線性等諸多難題,本文提出采用機(jī)器學(xué)習(xí)中的集成學(xué)習(xí)思想,對(duì)多個(gè)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行集成,以改
5、善失業(yè)預(yù)警的效果。二、BP神經(jīng)網(wǎng)絡(luò)[9]1986年,魯邁哈特(Rumelhart)等學(xué)者提出多層感知器的反向傳播(Backpropogation,BP)算法,這種學(xué)習(xí)算法使得多層感知器可以實(shí)現(xiàn)逼近任意復(fù)雜的非線性函數(shù),其拓?fù)浣Y(jié)構(gòu)如圖1所示。假設(shè)BP神經(jīng)網(wǎng)絡(luò)有M層,n維輸入向量為xp=(xp1,xp2,…,xpn)T,用Nj表示第j層神經(jīng)元的個(gè)數(shù),目標(biāo)輸出為d維的向量Tp=(Tp1,Tp2,…,Tpd)T,實(shí)際輸出為0p=(Op1,OP2,…,Opd),顯然NM=d,N0=n,Wjik表示連接從(j-1)層的第k個(gè)神經(jīng)元到第j層的第i個(gè)神經(jīng)元的權(quán)值,Yji表示第j層的
6、第i個(gè)神經(jīng)元的輸出,這樣就有YMi=Opi??紤]第j層第i個(gè)神經(jīng)元,如圖2所示。三、神經(jīng)網(wǎng)絡(luò)集成神經(jīng)網(wǎng)絡(luò)集成旨在通過(guò)訓(xùn)練多個(gè)神經(jīng)網(wǎng)絡(luò)個(gè)體,通過(guò)把它們集成起來(lái)以獲得比單個(gè)神經(jīng)網(wǎng)絡(luò)更好的分類或回歸效果。主要有兩種實(shí)現(xiàn)途徑:Bagging(BootstrapAggregating)與Boosting。1.Bagging算法[9-11]Bagging是1996年由布賴曼(Breiman)提出的基于分類器或者回歸機(jī)的集成技術(shù),其目的是提高原始分類器的精度或回歸機(jī)的穩(wěn)定性。Bagging還可以減少方差來(lái)避免過(guò)擬合現(xiàn)象,可以用于任何學(xué)習(xí)算法或回歸技術(shù)。假設(shè)訓(xùn)練樣本集D由n個(gè)訓(xùn)練樣
7、本組成,即{(xi,yi),i=1,2,…,n},有放回的從D中隨機(jī)抽取k個(gè)規(guī)模為n的樣本集合,記為S1,S2,…,Sk,這些樣本集合被稱為Bootstrap樣本集合,其中每一個(gè)樣本集合被稱為原始訓(xùn)練樣本的自展復(fù)制(BootstrapReplicate)。利用這k個(gè)訓(xùn)練樣本,可以訓(xùn)練k個(gè)回歸機(jī),記為fi(x),i=1,2,…,k,Bagging的結(jié)果是取這k個(gè)回歸機(jī)的簡(jiǎn)單平均,即其中f(x)是集成的回歸結(jié)果。2.Boostin9算法[9-11]最具代表性的Boosting算法是AdaBoost(AdaptiveBoosting),需要按順序訓(xùn)練一系列的神經(jīng)網(wǎng)絡(luò),