基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法

基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法

ID:19802450

大?。?26.50 KB

頁數(shù):23頁

時間:2018-10-06

基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法_第1頁
基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法_第2頁
基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法_第3頁
基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法_第4頁
基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法_第5頁
資源描述:

《基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在教育資源-天天文庫。

1、基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘方法0引言1數(shù)據(jù)挖掘技術2神經(jīng)網(wǎng)絡原理3基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘4結(jié)論20引言現(xiàn)代信息技術的高速發(fā)展,數(shù)據(jù)庫應用的規(guī)模、范圍不斷擴大,可獲得的數(shù)據(jù)量越來越大,數(shù)據(jù)的種類也日益繁多。面對如此大規(guī)模的、并且存在著“噪聲”的數(shù)據(jù),如何從中提取出隱含其中的有意義的、對決策有用的信息或知識,進一步提高信息利用率,成為“信息時代”亟待解決的一個問題。30引言20世紀90年代出現(xiàn)的數(shù)據(jù)挖掘技術受到不同領域研究學者的極大關注,盡管對數(shù)據(jù)挖掘的研究與應用還只處于初級階段,但是它的應用前景早已被各方面專家學者看好

2、。GarterGroup在1997年的一份報告中指出:數(shù)據(jù)挖掘技術將在未來的三到五年內(nèi)成為對全球影響最的一個關鍵技術領域。41數(shù)據(jù)挖掘技術數(shù)據(jù)挖掘的含義:數(shù)據(jù)挖掘,又稱數(shù)據(jù)庫中的知識發(fā)現(xiàn),就是從大量數(shù)據(jù)中獲取有效、新穎、潛在有用、最終可理解的模式的非平凡過程。簡單地說,數(shù)據(jù)挖掘就是從海量的數(shù)據(jù)中挖掘出可能有潛在價值的信息的技術。這些知識是是隱含的,事先未知的潛在的有用的信息。51數(shù)據(jù)挖掘技術數(shù)據(jù)挖掘的主要功能:①分類:按照對象的屬性、特征,建立不同的組類來描述事物。②聚類:識別出分析對象內(nèi)在的規(guī)則,按照這些規(guī)則把

3、對象分成若干類。61數(shù)據(jù)挖掘技術數(shù)據(jù)挖掘的主要功能:③關聯(lián)規(guī)則和序列模式:關聯(lián)是某種事物發(fā)生時其他事物會發(fā)生的這樣一種聯(lián)系。④預測:把握分析對象發(fā)展的規(guī)律,對未來的趨勢做出預見。⑤偏差的檢測:對分析對象的少數(shù)的、極端的特例的描述,揭示內(nèi)在的原因。71數(shù)據(jù)挖掘技術數(shù)據(jù)挖掘的處理過程:數(shù)據(jù)挖掘的過程主要分為5個部分:①問題的定義②數(shù)據(jù)準備③數(shù)據(jù)整理④建立模型⑤評價和解釋81數(shù)據(jù)挖掘技術數(shù)據(jù)挖掘的處理過程:91數(shù)據(jù)挖掘技術現(xiàn)行的數(shù)據(jù)挖掘方法:統(tǒng)計方法、關聯(lián)發(fā)現(xiàn)、聚類分析、分類與回歸和決策樹、聯(lián)機分析處理(OLAP)、查

4、詢工具、主管信息系統(tǒng)(EIS)等。這些方法幫助分析包含在數(shù)據(jù)倉庫中的數(shù)據(jù),它們的共同特點是問題驅(qū)動的。用戶必須提出許多問題,才能得到包含在復雜關系中的結(jié)果,當提不出問題或提出的問題不正確時,將得不到正確的數(shù)據(jù)。102神經(jīng)網(wǎng)絡原理神經(jīng)網(wǎng)絡是由大量并行分布式處理單元組成的簡單處理單元。它有通過調(diào)整連接強度而從經(jīng)驗知識進行學習的能力并可將這些知識進行運算。是模擬人腦的一種技術系統(tǒng)。113基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘由以下二個階段組成:網(wǎng)絡構(gòu)造、訓練和剪枝規(guī)則提取與評估123基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘網(wǎng)絡構(gòu)造

5、、訓練和剪枝:這個階段需要選擇擬采用的網(wǎng)絡模型,選擇或設計一種網(wǎng)絡訓練算法。訓練后的網(wǎng)絡可能有些臃腫,剪枝就是在不影響網(wǎng)絡準確性的前提下,將網(wǎng)絡中冗余的連接和結(jié)點去掉。沒有冗余結(jié)點和連接的網(wǎng)絡產(chǎn)生的模式更精練和更易于理解。133基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘規(guī)則提取和評估:這一階段從進化后產(chǎn)生的相對簡單的網(wǎng)絡中提取分類規(guī)則。規(guī)則提取目的就是從網(wǎng)絡中提取規(guī)則,并轉(zhuǎn)換為某種易理解的形式表達出來,如決策樹、模糊邏輯等方法。再利用測試樣本對規(guī)則的可靠性進行測試與評估,最后輸出有用知識。143基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘適合神經(jīng)網(wǎng)絡的數(shù)

6、據(jù)挖掘問題:分類是數(shù)據(jù)挖掘的一個主要問題。單層感知器的線性可分能力早已證明,但是對于非線性可分問題單層網(wǎng)絡是無能為力的??赏ㄟ^加入中間層,引入轉(zhuǎn)換函數(shù),將非分線性可分的問題映射后變?yōu)榫€性可分。一個多層的神經(jīng)網(wǎng)絡具有非常強的分類能力,并且分類誤差率較低。153基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘適合神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘問題:時序預測是依據(jù)當前已知的數(shù)據(jù)來預測將來未知數(shù)據(jù)的狀態(tài)。神經(jīng)網(wǎng)絡固有的輸人輸出映射特性,特別適合用來建立預測模型。不管是線性問題還是非線性問題,只要輸入輸出間存在連續(xù)映射關系,就可以用一個多層神經(jīng)網(wǎng)絡以任意精度來

7、逼近之。163基于神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘適合神經(jīng)網(wǎng)絡的數(shù)據(jù)挖掘問題:聚類是無監(jiān)督學習過程,它依據(jù)數(shù)據(jù)間的相似度將數(shù)據(jù)集劃分為不同的簇。目的是概觀數(shù)據(jù)的全貌,了解數(shù)據(jù)點的分布情況以及可能存在的問題。174結(jié)論神經(jīng)網(wǎng)絡的優(yōu)點:①非用戶驅(qū)動,用戶參與少,挖掘?qū)哟紊?。②處理變量較多,能處理定性變量,復雜、動態(tài)數(shù)據(jù),發(fā)現(xiàn)的事實或規(guī)則是以描述和可視性為主要目的。③分布記憶性和快速的計算能力。184結(jié)論神經(jīng)網(wǎng)絡的不足:①非數(shù)值型數(shù)據(jù)的處理:量化此類數(shù)據(jù)往往憑人們主觀經(jīng)驗而定,如果不能按實際情況進行量化,將影響挖掘結(jié)果。②數(shù)據(jù)質(zhì)量:

8、由于某些數(shù)據(jù)具有冗余或不完整性,致使產(chǎn)生的規(guī)則存在不真實和異常等問題。194結(jié)論神經(jīng)網(wǎng)絡的不足:③權值和閾值初值的確定:權值和閾值的初值影響算法的迭代次數(shù)和學習結(jié)果。④學習樣本的大?。簩τ跀?shù)據(jù)量較小的數(shù)據(jù)庫,可能出現(xiàn)錯誤的結(jié)果,這時就可以把這些數(shù)據(jù)作為新樣本補充到學習樣本中去。204結(jié)論神經(jīng)網(wǎng)絡的不足:⑤激勵函數(shù)的選?。杭詈瘮?shù)是對多個輸入進行處理產(chǎn)生輸出的功能模塊,它將

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。