數(shù)據(jù)分析展現(xiàn)與r語言01

數(shù)據(jù)分析展現(xiàn)與r語言01

ID:3910908

大小:1.53 MB

頁數(shù):54頁

時(shí)間:2017-11-25

數(shù)據(jù)分析展現(xiàn)與r語言01_第1頁
數(shù)據(jù)分析展現(xiàn)與r語言01_第2頁
數(shù)據(jù)分析展現(xiàn)與r語言01_第3頁
數(shù)據(jù)分析展現(xiàn)與r語言01_第4頁
數(shù)據(jù)分析展現(xiàn)與r語言01_第5頁
資源描述:

《數(shù)據(jù)分析展現(xiàn)與r語言01》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。

1、數(shù)據(jù)分析、展現(xiàn)與R語言第1課2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站多層模型2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站2數(shù)據(jù)分析?使用統(tǒng)計(jì)方法,有目的地對收集到的數(shù)據(jù)進(jìn)行分析處理,并且解讀分析結(jié)果2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站3數(shù)據(jù)分析?常用算法2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站4數(shù)據(jù)分析?數(shù)據(jù)分析工具2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站5數(shù)據(jù)挖掘?數(shù)據(jù)挖掘是以查找隱藏在數(shù)據(jù)中的信息為目標(biāo)的技術(shù),是應(yīng)用算法從大型數(shù)據(jù)庫中提取知識的過程,這些算法確定信息項(xiàng)之間的隱性關(guān)聯(lián),并且向用戶顯示這些關(guān)聯(lián)?數(shù)據(jù)挖掘

2、思想來源:假設(shè)檢驗(yàn),模式識別,人工智能,機(jī)器學(xué)習(xí)?常見數(shù)據(jù)挖掘任務(wù):關(guān)聯(lián)分析,聚類分析,孤立點(diǎn)分析等等?例:啤酒與尿布的故事?例:《Science》的文章《科學(xué)家摸索出大型數(shù)據(jù)集內(nèi)的趨勢》2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站6展現(xiàn)層:報(bào)表與圖形?老土的報(bào)表2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站7展現(xiàn)層?常見的報(bào)表2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站8展現(xiàn)層?儀表盤2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站9展現(xiàn)層?一些有趣的圖表2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站10展現(xiàn)層?某條微博的擴(kuò)散路徑2013.04

3、.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站11展示層?MrAndroid根據(jù)信息圖顯示,Android先生的頭發(fā)有47%的可能是黑色的,戴眼鏡的幾率為37%,有36%的可能是北美人,30%的可能臉上長雀斑。71%的時(shí)間會(huì)穿T恤,下身穿牛仔褲的時(shí)間占了62%。工作只占了38%,玩游戲卻占了62%,平均每個(gè)月會(huì)用掉582MB的數(shù)據(jù)流量。2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站12展示層?MrAndroid2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站13展示層?網(wǎng)站點(diǎn)擊“熱力圖”2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站14商業(yè)智能?BusinessInte

4、lligence,簡寫為BI?BI=數(shù)據(jù)倉庫(存儲層)+數(shù)據(jù)分析和數(shù)據(jù)挖掘(分析層)+報(bào)表(展現(xiàn)層)?我們課程的位置2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站15R?R的源起R是S語言的一種實(shí)現(xiàn)。S語言是由AT&T貝爾實(shí)驗(yàn)室開發(fā)的一種用來進(jìn)行數(shù)據(jù)探索、統(tǒng)計(jì)分析、作圖的解釋型語言。最初S語言的實(shí)現(xiàn)版本主要是S-PLUS。S-PLUS是一個(gè)商業(yè)軟件,它基于S語言,并由MathSoft公司的統(tǒng)計(jì)科學(xué)部進(jìn)一步完善。后來Auckland大學(xué)的RobertGentleman和RossIhaka及其他志愿人員開發(fā)了一個(gè)R系統(tǒng)。R的使用與S-PLUS有很多類似之處,兩個(gè)軟件有一定的兼

5、容性。2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站16R?RisfreeR是用于統(tǒng)計(jì)分析、繪圖的語言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲和處理系統(tǒng);數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡便而強(qiáng)大的編程語言:可操縱數(shù)據(jù)的輸入和輸入,可實(shí)現(xiàn)分支、循環(huán),用戶可自定義功能。R是一個(gè)免費(fèi)的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費(fèi)下載和使用的,在那兒可

6、以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個(gè)基礎(chǔ)模塊,其他外在模塊可以通過CRAN獲得。R官方網(wǎng)站地址:http://www.r-project.org2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站17R?R的特點(diǎn)1.有效的數(shù)據(jù)處理和保存機(jī)制。2.擁有一整套數(shù)組和矩陣的操作運(yùn)算符。3.一系列連貫而又完整的數(shù)據(jù)分析中間工具。4.圖形統(tǒng)計(jì)可以對數(shù)據(jù)直接進(jìn)行分析和顯示,可用于多種圖形設(shè)備。5.一種相當(dāng)完善、簡潔和高效的程序設(shè)計(jì)語言。它包括條件語句、循環(huán)語句、用戶自定義的遞歸函數(shù)以及輸入輸出接口。6.R語言是徹底面向?qū)ο蟮慕y(tǒng)計(jì)編程語言。7.R語言和其它編

7、程語言、數(shù)據(jù)庫之間有很好的接口。8.R語言是自由軟件,可以放心大膽地使用,但其功能卻不比任何其它同類軟件差。9.R語言具有豐富的網(wǎng)上資源2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站18R?商業(yè)版本的RRevolutionR(官網(wǎng):http://www.revolutionanalytics.com/)很多大型廠商也在開始推出自己的R或兼容R的產(chǎn)品,例如Oracle、IBM、Sybase2013.04.12DATAGURU專業(yè)數(shù)據(jù)分析網(wǎng)站19R語言2013.04.12DATAGURU專

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。