資源描述:
《《數(shù)據(jù)分析實(shí)例》PPT課件》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、數(shù)據(jù)分析數(shù)據(jù)分析的含義:數(shù)據(jù)分析就是根據(jù)電子表格中的數(shù)據(jù)以圖形或數(shù)值的方式得出一些有意義的結(jié)論.比如:數(shù)據(jù)的排序,篩選,運(yùn)算,統(tǒng)計(jì),圖表化等等都可以說(shuō)是數(shù)據(jù)分析的手段.這里我們主要講以下幾個(gè)數(shù)據(jù)分析問(wèn)題:一.變量求解:有些數(shù)據(jù)之間存在因果關(guān)系,這些因果關(guān)系可以用數(shù)學(xué)模型來(lái)描述,如方程式,不等式等,如果知道了結(jié)果數(shù)據(jù),能否根據(jù)這些數(shù)學(xué)模型求出原因變量的值?EXCEL提供一些這樣的方法,如單變量求解,規(guī)劃求解等.二.模擬運(yùn)算表:根據(jù)數(shù)學(xué)模型(公式)為一組假設(shè)數(shù)據(jù)產(chǎn)生預(yù)測(cè)結(jié)果,以供分析決策三.相關(guān)性分析
2、:判斷兩組數(shù)據(jù)集(可以使用不同的度量單位)之間的關(guān)系。四.回歸分析:當(dāng)一個(gè)結(jié)果與一個(gè)或多個(gè)參數(shù)之間存在聯(lián)系時(shí),可以進(jìn)行回歸分析,通??捎梢粋€(gè)或多個(gè)自變量來(lái)預(yù)測(cè)一個(gè)變量的值。1數(shù)據(jù)分析方法1.分析工具庫(kù)Excel提供了一組數(shù)據(jù)分析工具,稱(chēng)為“分析工具庫(kù)”,在建立復(fù)雜統(tǒng)計(jì)或工程分析時(shí)可節(jié)省步驟。只需為每一個(gè)分析工具提供必要的數(shù)據(jù)和參數(shù),該工具就會(huì)使用適宜的統(tǒng)計(jì)或工程函數(shù),在輸出表格中顯示相應(yīng)的結(jié)果。其中有些工具在生成輸出表格時(shí)還能同時(shí)生成圖表。安裝“分析工具庫(kù)”:要使用查看可用的分析工具,請(qǐng)單擊“工具
3、”菜單中的“數(shù)據(jù)分析”命令。如果“工具”菜單中沒(méi)有“數(shù)據(jù)分析”命令,則需要安裝“分析工具庫(kù)”。2.工作表函數(shù)Excel還提供了其他一些統(tǒng)計(jì)、財(cái)務(wù)和工程函數(shù)。某些統(tǒng)計(jì)函數(shù)是內(nèi)置函數(shù),而其他一些函數(shù)只有在安裝了“分析工具庫(kù)”之后才能使用。預(yù)備知識(shí)要使用這些工具,用戶(hù)還必須熟悉需要進(jìn)行分析的統(tǒng)計(jì)學(xué)或工程學(xué)的特定領(lǐng)域。2三.相關(guān)性分析相關(guān)性分析:判斷兩組數(shù)據(jù)集(可以使用不同的度量單位)之間的關(guān)系。相關(guān)系數(shù)(R):相關(guān)性計(jì)算的返回值。用來(lái)確定兩個(gè)區(qū)域中數(shù)據(jù)的變化是否相關(guān),以及相關(guān)的程度。是兩組數(shù)據(jù)集的協(xié)方差
4、除以它們標(biāo)準(zhǔn)偏差的乘積。1、R>0:一個(gè)集合的較大數(shù)據(jù)與另一個(gè)集合的較大數(shù)據(jù)相對(duì)應(yīng)(正相關(guān))2、R<0:一個(gè)集合的較大數(shù)據(jù)與另一個(gè)集合的較小數(shù)據(jù)相對(duì)應(yīng)(負(fù)相關(guān))3、R=0:兩個(gè)集合中的數(shù)據(jù)互不相關(guān)。
5、R
6、<0.4:低度相關(guān);0.4<=
7、R
8、<0.6:中度相關(guān);0.6<=
9、R
10、<0.8:高度相關(guān);
11、R
12、>=0.8:非常高度相關(guān)31、CORREL函數(shù):CORREL(array1,array2)返回單元格區(qū)域array1和array2之間的相關(guān)系數(shù)。使用相關(guān)系數(shù)可以確定兩種屬性之間的關(guān)系。例如,可以檢測(cè)
13、某地的平均溫度和空調(diào)使用情況之間的關(guān)系。Array1第一組數(shù)值單元格區(qū)域。Array2第二組數(shù)值單元格區(qū)域。如果數(shù)組或引用包含文本、邏輯值或空白單元格,這些數(shù)值將被忽略,但是包含零值的單元格將計(jì)算在內(nèi)。如果array1和array2的數(shù)據(jù)點(diǎn)的數(shù)目不同,函數(shù)CORREL返回錯(cuò)誤值#N/A。4例1、利用統(tǒng)計(jì)數(shù)據(jù)計(jì)算廣告費(fèi)與銷(xiāo)售額之間的相關(guān)系數(shù)。相關(guān)系數(shù)CORREL(B4:B15,C4:C15)=0.922518185例2.我們收集了某廠家同一車(chē)型中舊車(chē)的車(chē)齡及其售價(jià)數(shù)據(jù),求價(jià)格與車(chē)齡的相關(guān)系數(shù)6例3
14、、總平均成績(jī)、出勤率、選修學(xué)分與每周打工小時(shí)數(shù)的關(guān)系。2、使用數(shù)據(jù)分析工具求相關(guān)矩陣?yán)肅ORREL函數(shù)只能返回兩種屬性之間的相關(guān)系數(shù),如果使用Excel提供的“數(shù)據(jù)分析”工具可以計(jì)算多組數(shù)據(jù)間的相關(guān)系數(shù),組成相關(guān)系數(shù)表。7例利用“數(shù)據(jù)分析”工具計(jì)算汽車(chē)扳金、省油與價(jià)格的滿(mǎn)意度之間的相關(guān)系數(shù)。8回歸分析:當(dāng)一個(gè)結(jié)果與一個(gè)或多個(gè)參數(shù)之間存在聯(lián)系時(shí),可以進(jìn)行回歸分析,通??捎梢粋€(gè)或多個(gè)自變量來(lái)預(yù)測(cè)一個(gè)變量的值。回歸方程:表達(dá)參數(shù)與結(jié)果之間相互關(guān)系的數(shù)學(xué)方程式(數(shù)學(xué)模型)線(xiàn)性回歸:如果變量與結(jié)果之間具有
15、線(xiàn)性關(guān)系,我們可以用線(xiàn)性方程式來(lái)描述它們之間的關(guān)系,這種回歸方法叫線(xiàn)性回歸.非線(xiàn)性回歸:如果變量與結(jié)果之間不具有線(xiàn)性關(guān)系,我們必須用非線(xiàn)性方程式來(lái)描述它們之間的關(guān)系(如指數(shù)關(guān)系,對(duì)數(shù)關(guān)系等等),這種回歸方法叫非線(xiàn)性回歸.單回歸:當(dāng)一個(gè)結(jié)果只與一個(gè)參數(shù)存在聯(lián)系時(shí),進(jìn)行的回歸分析稱(chēng)為單回歸。復(fù)回歸:當(dāng)一個(gè)結(jié)果與多個(gè)參數(shù)存在聯(lián)系時(shí),進(jìn)行的回歸分析稱(chēng)為復(fù)回歸。判定系數(shù)(R2):用來(lái)確定回歸方程式的可解釋性,即吻合程度。范圍在0-1之間,越接近1,解釋性越強(qiáng),即吻合程度越高。回歸方法:1、給圖表增加趨勢(shì)線(xiàn);
16、2、使用Excel提供的“數(shù)據(jù)分析工具”;3、利用回歸函數(shù)四.回歸分析9例4(線(xiàn)性回歸)、我們收集了某廠家同一車(chē)型中舊車(chē)的車(chē)齡及其售價(jià)數(shù)據(jù),請(qǐng)使用給圖表增加趨勢(shì)線(xiàn),求車(chē)齡對(duì)售價(jià)的回歸方程,并計(jì)算車(chē)齡為6.5年的舊車(chē)售價(jià)是多少.車(chē)齡價(jià)格(萬(wàn))156.0248.5342.0437.6532.5628.7722.2818.5915.01012.56.5年的舊車(chē)車(chē)價(jià)==-4.8091*6.5+57.8=26.541、給圖表增加趨勢(shì)線(xiàn)進(jìn)行回歸分析1011有些數(shù)據(jù)間并不是簡(jiǎn)單的線(xiàn)性關(guān)系,如果用