資源描述:
《常用數(shù)據(jù)挖掘工具介紹.docx》由會員上傳分享,免費在線閱讀,更多相關內容在教育資源-天天文庫。
1、常用數(shù)據(jù)挖掘工具介紹1.SAS統(tǒng)計分析軟件SAS統(tǒng)計分析軟件是用于數(shù)據(jù)分析與決策支持的大型集成式模塊化軟件包。它由數(shù)十個專用模塊構成,功能包括數(shù)據(jù)訪問、數(shù)據(jù)儲存及管理、應用開發(fā)、圖形處理、數(shù)據(jù)分析、報告編制、運籌學方法、計量經(jīng)濟學與預測等。SAS統(tǒng)計分析軟件特點如下:?信息存儲簡便靈活?語言編程能力強?豐富的統(tǒng)計分析方法?較強的統(tǒng)計報表與繪圖功能?友好的用戶界面?宏功能?支持分布式處理?采用輸出分發(fā)系統(tǒng)?功能強大的系統(tǒng)閱讀器SAS統(tǒng)計分析軟件界面如下:SAS分析案例如下:1.Clementine數(shù)據(jù)挖掘軟件Clementine是ISL(Integral?Solutions
2、?Limited)公司開發(fā)的數(shù)據(jù)挖掘工具平臺。Clementine基于圖形化的界面提供了大量的人工智能、統(tǒng)計分析的模型(神經(jīng)網(wǎng)絡,關聯(lián)分析,聚類分析、因子分析等)。Clementine軟件特點如下:?支持圖形化界面、菜單驅動、拖拉式的操作?提供豐富的數(shù)據(jù)挖掘模型和靈活算法?具有多模型的整合能力,使得生成的模型穩(wěn)定和高效?數(shù)據(jù)挖掘流程易于管理、可再利用、可充分共享?提供模型評估方法?數(shù)據(jù)挖掘的結果可以集成于其他的應用中?滿足大數(shù)據(jù)量的處理要求?能夠對挖掘的過程進行監(jiān)控,及時處理異常情況?具有并行處理能力?支持訪問異構數(shù)據(jù)庫?提供豐富的接口函數(shù),便于二次開發(fā)?挖掘結果可以轉化
3、為主流格式的適當圖形Clementine軟件界面如下:Clementine分析案例如下:1.R統(tǒng)計軟件R是屬于GNU系統(tǒng)的一個自由、免費、開放源代碼的軟件,是一個用于統(tǒng)計計算、數(shù)據(jù)分析和統(tǒng)計制圖的優(yōu)秀工具。作為一個免費的統(tǒng)計軟件,它有UNIX、LINUX、MacOS和WINDOWS等版本,均可免費下載使用。?R是一套完整的數(shù)據(jù)處理、計算和制圖軟件系統(tǒng)。其功能包括:?數(shù)據(jù)存儲和處理系統(tǒng);?數(shù)組運算工具(其向量、矩陣運算方面功能尤其強大);?完整連貫的統(tǒng)計分析工具;?優(yōu)秀的統(tǒng)計制圖功能;?簡便而強大的編程語言:可操縱數(shù)據(jù)的輸入和輸出,可實現(xiàn)分支、循環(huán),用戶可自定義功能。R軟件
4、界面如下:R分析案例一如下:R分析案例二如下:1.SPSS分析軟件SPSS(Statistical?Product?and?Service?Solutions),“統(tǒng)計產(chǎn)品與服務解決方案”軟件,是世界上最早采用圖形菜單驅動界面的統(tǒng)計軟件,其主要特點是操作簡便,編程方便,功能強大,針對性強,全面的數(shù)據(jù)接口,靈活的功能模塊組合。SPSS分析軟件特點如下:?操作簡單除了數(shù)據(jù)錄入及部分命令程序等少數(shù)輸入工作需要鍵盤鍵入外,大多數(shù)操作可通過“菜單”、“按鈕”和“對話框”來完成。??無須編程具有第四代語言的特點,告訴系統(tǒng)要做什么,無需告訴怎樣做。只要了解統(tǒng)計分析的原理,無需通曉統(tǒng)計方
5、法的各種算法,即可得到需要的統(tǒng)計分析結果。對于常見的統(tǒng)計方法,SPSS的命令語句、子命令及選擇項的選擇絕大部分由“對話框”的操作完成。因此,用戶無需花大量時間記憶大量的命令、過程、選擇項。??功能強大具有完整的數(shù)據(jù)輸入、編輯、統(tǒng)計分析、報表、圖形制作等功能。自帶11種類型136個函數(shù)。SPSS提供了從簡單的統(tǒng)計描述到復雜的多因素統(tǒng)計分析方法,比如數(shù)據(jù)的探索性分析、統(tǒng)計描述、列聯(lián)表分析、二維相關、秩相關、偏相關、方差分析、非參數(shù)檢驗、多元回歸、生存分析、協(xié)方差分析、判別分析、因子分析、聚類分析、非線性回歸、Logistic回歸等。??方便的數(shù)據(jù)接口能夠讀取及輸出多種格式的文
6、件。比如由dBASE、FoxBASE、FoxPRO產(chǎn)生的*.dbf文件,文本編輯器軟件生成的ASCⅡ數(shù)據(jù)文件,Excel的*.xls文件等均可轉換成可供分析的SPSS數(shù)據(jù)文件。能夠把SPSS的圖形轉換為7種圖形文件。結果可保存為*.txt及html格式的文件。??靈活的功能模塊組合SPSSforWindows軟件分為若干功能模塊。用戶可以根據(jù)自己的分析需要和計算機的實際配置情況靈活選擇。?K-均值聚類SPSS分析案例如下:快速聚類SPSS分析案例如下: