資源描述:
《基礎(chǔ)統(tǒng)計(jì)與R作圖》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、一、數(shù)值變量的統(tǒng)計(jì)描述在R中沒有一個(gè)直接的統(tǒng)計(jì)描述命令,可以把常見的指標(biāo)都一起算出來。如概述中所說,R往往是提供一些比較基礎(chǔ)的統(tǒng)計(jì)命令,需要使用者自己編程組合。?1、算術(shù)均數(shù):mean(x)例如:c(12,13,14)->xmean(x)???????將輸出x的均數(shù)13。?2、中位數(shù):median(x)?3、幾何均數(shù):我沒有找到計(jì)算幾何均數(shù)的命令,但可以通過對(duì)數(shù)函數(shù)來算幾何均數(shù)。例如:log(x,10)->y??――――――――――將x取自然對(duì)數(shù)mean(y)->z???――――――――――計(jì)算y的算術(shù)平均數(shù)10^z????????――――――――――將z取反對(duì)數(shù),即得x的幾何平均數(shù)?4、極
2、差:max(x)-min(x)?5、樣本方差:var(x)?6、樣本標(biāo)準(zhǔn)差:sd(x)請(qǐng)注意都是“樣本”。?7、變異系數(shù):(sd(x)/mean(x))*100?通過以上命令和程序,可以求出想要的描述指標(biāo)。?二、分類變量的統(tǒng)計(jì)描述1、table(x)???????該命令可以輸出變量中各個(gè)值的絕對(duì)頻數(shù)。?2、table(x/sum(x))?可輸出相對(duì)數(shù)的頻數(shù)。這個(gè)方法一般,還要把頻數(shù)*百分比,不過我沒有找到更好的方法。?3、table(x,y)?????可輸出絕對(duì)頻數(shù)的交叉表???分類資料的描述,我還沒有找到較好的命令。如有人知道,請(qǐng)指教。三、正態(tài)性檢驗(yàn)可采用Shapiro-Wilk檢驗(yàn)。程序
3、如下:library(ctest)――――――先加載ctest模塊,許多檢驗(yàn)方法都在此模塊中。shapiro.test(x)―――――-可對(duì)x進(jìn)行正態(tài)性檢驗(yàn)。?四、方差齊性檢驗(yàn)程序如下:var.test(x,y)――――――可對(duì)x和y進(jìn)行方差齊性檢驗(yàn)。?五、統(tǒng)計(jì)圖制作R是統(tǒng)計(jì)制圖的高手。1、直方圖:hist例如:rnorm(1000)->gg――――――――――――產(chǎn)生樣本量為1000的正態(tài)樣本hist(gg)――――――――――――――――制圖???????結(jié)果如下:?2、餅圖:pie例如:c(1,2,2,5)->x――――――――――――――――――賦值y<-x/sum(x)――――――
4、――――――――――――計(jì)算x的構(gòu)成比names(y)<-c(“tom”,”bill”,”reed”,”jane”)―――――――給每一個(gè)賦名pie(y,col=c(“green”,”red”,”brown”,”white”))―――――制圖,col為取色結(jié)果如下:??3、散點(diǎn)圖:plot例如:c(1,6,5,8,3,2,1,6,5,4,8,5,4,7)->xc(6,5,4,8,7,4,6,5,8,4,7,1,4,5)->yplot(x,y)???????結(jié)果如下:?4、箱式圖:boxplot例如:rnorm(10)->xboxplot(x)結(jié)果如下:????R的制圖功能非常強(qiáng)大,是R的亮點(diǎn)
5、之一。一、變量數(shù)據(jù)直接輸入1、數(shù)值變量如果有一個(gè)變量,變量名為x,其數(shù)據(jù)如下:12,15,46,23,15。命令語句如下:x<-c(12,15,46,23,15)?或??c(12,15,46,23,15)->x其中:x為變量名;<-與->為賦值符;c()為向量建立函數(shù),表示把括號(hào)中的數(shù)據(jù)建立為一個(gè)向量。以上命令語句建立了一個(gè)數(shù)值變量x。?2、字符變量字符變量的建立與數(shù)值變量一致。字符串使用引號(hào)(單、雙均可),如:y<-c(“er”,”sdf”,”eir”,”jk”,”dim”)??或??c(“er”,”sdf”,”eir”,”jk”,”dim”)->y將建立字符變量y。?3、邏輯變量邏輯變量
6、中的元素是:TRUE(或簡寫為T)、FALSE(F)、NA(表示缺省)。請(qǐng)注意必須都是大寫。邏輯變量可以直接輸入,如:z<-c(TRUE,FALSE,F,T,NA)可建立邏輯變量z。?1可以表示T,0可以表示F。所以可以直接寫成:z<-c(1,0,0,1,NA)在計(jì)算時(shí),T和F也是當(dāng)作1和0來用的。?二、建立數(shù)據(jù)集在上面,我們建立起了三個(gè)變量:x,y,z。如果要建立起一個(gè)三變量的數(shù)據(jù)集,即含有x、y、z的二維表,則可使用data.frame()函數(shù)。當(dāng)然,在這種情況下,要求變量的長度是一樣的。dd<-data.frame(x,y,z)便可建立數(shù)據(jù)集dd。?edit(dd)可調(diào)用R中的數(shù)據(jù)編輯
7、器顯示、編輯數(shù)據(jù)集dd。如圖2-1。?如果eidt()編輯的是一維的向量,如:edit(x),那么它便會(huì)調(diào)用記事本來編輯,而不會(huì)調(diào)用數(shù)據(jù)編輯器。如圖2-2。圖2-1?圖2-2?三、從其他文件中讀取數(shù)據(jù)在應(yīng)用統(tǒng)計(jì)學(xué)中,數(shù)據(jù)量一般是比較大的,變量也很多。如果用上述方法來建立數(shù)據(jù)集,好像辛苦了一些。上述方法適用于少量數(shù)據(jù)、少量變量的分析。對(duì)于大量數(shù)據(jù)和變量,一般應(yīng)在其他軟件中輸好,再讀R中處理。?1、讀入輸好的純文