資源描述:
《R語言學(xué)習(xí)過程各種筆記.doc》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫。
1、.數(shù)據(jù)挖掘與數(shù)據(jù)分析的主要區(qū)別是什么?數(shù)據(jù)分析就是為了處理原有計(jì)算方法、統(tǒng)計(jì)方法,著重點(diǎn)就是數(shù)據(jù)、算法、統(tǒng)計(jì)、數(shù)值。數(shù)據(jù)挖掘是從龐大的數(shù)據(jù)庫中分析出有目標(biāo)數(shù)據(jù)群,篩選出利于決策的有效信息簡單來說就是數(shù)據(jù)分析是針對以往取得的成績,比如說哪方面做得好,哪方面需要改進(jìn);數(shù)據(jù)挖掘就是通過以前的成績預(yù)測未來的發(fā)展的趨勢,并且為決策者提供建議。?讀excel時可以先復(fù)制再運(yùn)行data<-read.table("clipboard",header=T,sep='t')在R語言中,使用“=”和“<-”到底有什么不同?就是等號和箭頭號有什么區(qū)別,是完全一樣還是局部不同?R里通常用
2、符號”<-”代替其它語言里的”=”來作賦值符號。因?yàn)榍罢咔闷饋肀鹊忍栆闊?,且大部分情況下兩者是等價的,所以通常就愉懶依舊用”=”來賦值。但要切記兩者在某些時候是有區(qū)別的。字面上的解釋,可以認(rèn)為”<-”是賦值,”=”是傳值。在函數(shù)調(diào)用中,func(x=1)與func(x<-1)是有區(qū)別的,前者調(diào)用完后變量x不會被保留,而后者會在工作區(qū)里保留變量x=1。Word資料.再如length(x=seq(1,10))計(jì)算完成后x不會被保留,而length(x<-seq(1,10))計(jì)算完后你會在工作區(qū)里發(fā)現(xiàn)x這個變量。矩陣知識:1_矩陣的生成2_矩陣的四則運(yùn)算3_矩陣的矩陣
3、運(yùn)算4_矩陣的分解1_1將向量定義成數(shù)組向量只有定義了維數(shù)向量(dim屬性)后才能被看作是數(shù)組.比如:>z=1:12;>dim(z)=c(3,4);>z;[,1][,2][,3][,4][1,]14710[2,]25811[3,]36912注意:生成矩陣是按列排列的。1_2用array()函數(shù)構(gòu)造多維數(shù)組用法為:array(data=NA,dim=length(data),dimnames=NULL)Word資料.參數(shù)描述:data:是一個向量數(shù)據(jù)。dim:是數(shù)組各維的長度,缺省時為原向量的長度。dimname:是數(shù)組維的名字,缺省時為空。例子:>x=array(
4、1:20,dim=c(4,5))>x[,1][,2][,3][,4][,5][1,]1591317[2,]26101418[3,]37111519[4,]481216201_3用matrix()函數(shù)構(gòu)造矩陣函數(shù)matrix)是構(gòu)造矩陣(二維數(shù)組)的函數(shù),其構(gòu)造形式為matrix(data=NA,nrow=1,ncol=1,byrow=FALSE,dimnames=NULL)其中data是一個向量數(shù)據(jù),nro、是矩陣的行數(shù),ncol是矩陣的列數(shù).當(dāng)byrow=TRUE時,生成矩陣的數(shù)據(jù)按行放置,缺省時相當(dāng)于byrow=FALSE,數(shù)據(jù)按列放置.dimname。是數(shù)組
5、維的名字,缺省時為空.如構(gòu)造一個3x5階的矩陣>A=matrix(1:15,nrow=3,byrow=TRUE)>A[,1][,2][,3][,4][,5][1,]12345Word資料.[2,]678910[3,]11121314152_矩陣的四則運(yùn)算可以對數(shù)組之間進(jìn)行四則運(yùn)算(+、一、*、/),這時進(jìn)行的是數(shù)組對應(yīng)元素的四則運(yùn)算。一般情況下參加運(yùn)算的矩陣或者數(shù)組的維數(shù)是相同的,但也可以計(jì)算不同維的,這是要將對應(yīng)的元素補(bǔ)足。3_1轉(zhuǎn)置運(yùn)算對于矩陣A,函數(shù)t(A)表示矩陣A的轉(zhuǎn)置,如:>A=matrix(1:6,nrow=2);>A;[,1][,2][,3][1,
6、]135[2,]246>t(A);[,1][,2][1,]12[2,]34[3,]563_2求方陣的行列式函數(shù)det()是求矩陣行列式的值,如>det(matrix(1:4,ncol=2));Word資料.[1]-23_3向量的內(nèi)積對于n維向量x,可以看成nxl階矩陣或lxn階矩陣。若x與y是相同維數(shù)的向量,則x%*%Y表示x與y作內(nèi)積.例如,>x=1:5;Y=2*1:5>x%*%y[,1][1,]110函數(shù)crossprod()是內(nèi)積運(yùn)算函數(shù)(表示交叉乘積),crossprod(x,y)計(jì)算向量x與y的內(nèi)積,即t(x)%*%y'。crossprod(x)表示x與
7、x的內(nèi)積.類似地,tcrossprod(x,y)表示’x%*%t(Y)’,即x與y的外積,也稱為叉積。tcrossprod(x)表示x與x作外積.如:>x=1:5;y=2*1:5;>crossprod(x);[,1][1,]55>crossprod(x,y);[,1][1,]110>tcrossprod(x);[,1][,2][,3][,4][,5]Word資料.[1,]12345[2,]246810[3,]3691215[4,]48121620[5,]510152025>tcrossprod(x,y);[,1][,2][,3][,4][,5][1,]246810
8、[2,]4