資源描述:
《基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、基于神經(jīng)網(wǎng)絡(luò)的數(shù)據(jù)挖掘算法研究神經(jīng)網(wǎng)絡(luò)可以實現(xiàn)分類、預測等多種網(wǎng)絡(luò)模型。將神經(jīng)網(wǎng)絡(luò)的BP(前饋神經(jīng)網(wǎng)絡(luò))和SVM(支持向量機)數(shù)據(jù)挖掘算法應(yīng)用于丙安地區(qū)的空氣質(zhì)量預測,雖然它們的泛化和收?磕芰2煌?,但通過以往的歷史數(shù)據(jù)訓練網(wǎng)絡(luò)模型。實驗結(jié)果證明該算法可以較準確地預測未來的數(shù)據(jù)。版權(quán)和著作權(quán)歸原作者所存,如存不愿意被轉(zhuǎn)載的情況,己關(guān)鍵詞:BP神經(jīng)網(wǎng)絡(luò);支持向量機;核函數(shù);數(shù)據(jù)挖掘TN711934A1004?373X(2017)11?0111?04ResearchondataminingalgorithmbasedonneuralnetworkWANGChunmci
2、(SchoolofComputerScienceandTechnology,Xi’anUniversityofPostsandTelecommunications,Xi?an710121,China)Abstract:Theneuralnetworkcanclassifyandpredictthevariousnetworkmodels.ThedataminingalgorithmbasedonBPneuralnetworkandSVMisappliedtotheairqualitypredictioninXi’anregion.AlthoughtheBPneur
3、alnetworkandSVMmethodhavedifferentgeneralizationabilityandconvergenceability,thepasthistoricaldataisusedtotrainthenetworkmodel.Theexperimentalresultsprovethatthedataminingalgorithmcanpredictthefuturedataaccurately.Keywords:BPneuralnetwork;supportvectormachine;kernelfunction;datamining
4、0引言近年來空氣污染嚴重,空氣問題不容忽視,準確的空氣質(zhì)量預測具有極大的現(xiàn)實意義。神經(jīng)網(wǎng)絡(luò)算法在數(shù)據(jù)挖掘中占有重要的地位,因為網(wǎng)絡(luò)模型、復雜度等不同,神經(jīng)網(wǎng)絡(luò)可以擬合各種曲線實現(xiàn)分類、預測等多種模式,至今神經(jīng)網(wǎng)絡(luò)已經(jīng)研究出了多種類型來適應(yīng)不同的耍求神經(jīng)網(wǎng)絡(luò)要求網(wǎng)絡(luò)模型對訓練數(shù)據(jù)集存比較好的逼近能力,也需要對訓練集之外的分布數(shù)據(jù)能給出比較精準的預測。泛化能力即經(jīng)過訓練學習得到的預測模型,對沒有在訓練集中出現(xiàn)但是具有一定規(guī)則的數(shù)據(jù)能有比較準確的預測能力,不只是荇通的保存學過的樣本,而是需要進行有限次數(shù)據(jù)的訓練,找到未知的規(guī)律。本文基于神經(jīng)網(wǎng)絡(luò)的BP算法和SVM算法利用
5、匕存的歷史數(shù)據(jù)訓練網(wǎng)絡(luò)模型,對未來的天氣進行較為準確的預測工作。1BP算法前饋神經(jīng)網(wǎng)絡(luò)是一種典型的神經(jīng)網(wǎng)絡(luò)模型,網(wǎng)絡(luò)具有分層結(jié)構(gòu),輸入數(shù)據(jù)從輸入層進入到前饋神經(jīng)網(wǎng)絡(luò),經(jīng)過輸入層和隱層傳遞到輸出層。不同的前饋網(wǎng)絡(luò)節(jié)點限制函數(shù)、神經(jīng)元個數(shù)、隱層個數(shù)、權(quán)重修改方法能夠?qū)崿F(xiàn)擁有多樣能力的前饋神經(jīng)網(wǎng)絡(luò)。只存一個隱層的感知器只能解決輸入數(shù)據(jù)線性能夠區(qū)分的問題,但很多分類問題的輸入數(shù)據(jù)都是線性不能區(qū)分的。要完成線性不可分的難題,需要在結(jié)構(gòu)中加入隱層。含有多隱層的前饋網(wǎng)絡(luò)相比于單層感知器的區(qū)分效果有明顯的提升。因為誤差相反傳遞算法經(jīng)常用于神經(jīng)網(wǎng)絡(luò),所以也叫BP網(wǎng)絡(luò)。1.1基本思想
6、BP學習過程分為兩個過程,即輸入數(shù)據(jù)經(jīng)過輸入層和隱層正向流給輸出層,輸出層的誤差經(jīng)隱層反傳給輸入層。正向傳播時,輸入數(shù)據(jù)從輸入層到達,經(jīng)過每個隱層的加工后,再傳遞給最后的輸出層。如果輸出數(shù)據(jù)達不到預期目標,則進入誤差的反向傳遞。誤差的反向傳遞是指將最后一層的誤差經(jīng)過某種方法,經(jīng)網(wǎng)絡(luò)的隱層反轉(zhuǎn)傳遞向輸入層,將誤差均勻給網(wǎng)絡(luò)每個層的所有神經(jīng)元節(jié)點,因此得到網(wǎng)絡(luò)每層神經(jīng)元節(jié)點的誤差信號,通過節(jié)點獲得的誤差來調(diào)整節(jié)點。這兩部分反復,通過不斷地權(quán)重修改將誤差減少到比較滿意的情況,或達到學習次數(shù)上限1.2基本原理三層BP網(wǎng)絡(luò)模型圖如圖1所示。在該三層前饋網(wǎng)絡(luò)中,為輸入向量,代
7、表隱層神經(jīng)元節(jié)點的閾值;隱層輸出為圖1中是為輸出層神經(jīng)元引入閾值設(shè)置的;輸出層的輸出向量為預期輸出網(wǎng)絡(luò)的隱層和網(wǎng)絡(luò)輸入層的權(quán)值用矩陣表示;用表示網(wǎng)絡(luò)隱層到M絡(luò)輸出層的權(quán)值矩陣。對于輸出層來說:(1)對于隱層來說:(2)轉(zhuǎn)移函數(shù)為:(3)1.3學習算法當網(wǎng)絡(luò)輸出距離預期結(jié)果有差距時,代表輸出誤差。隱層:(4)輸入層:(5)據(jù)式(5)得知,網(wǎng)絡(luò)誤差展幵到輸入層只和有關(guān),要想減小誤差,就要修改神經(jīng)元的權(quán)值。假設(shè)網(wǎng)絡(luò)有個隱層,神經(jīng)元數(shù)代表網(wǎng)絡(luò)隱層的輸出,為權(quán)重,則權(quán)重修改公式如下:輸出層:第個隱層:(7)遞推可得:(8)在BP算法中,所有的權(quán)重修改公式都一樣,都取決于學習
8、率、輸入和