資源描述:
《數(shù)據(jù)整理與數(shù)據(jù)分析》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在應(yīng)用文檔-天天文庫。
1、實驗1數(shù)據(jù)整理與數(shù)據(jù)分析1.1數(shù)據(jù)整理一、實驗?zāi)康暮鸵螅耗苁炀毜倪M行統(tǒng)計數(shù)據(jù)的錄入、分組、匯總及各種常用統(tǒng)計圖表的繪制。二、實驗內(nèi)容:1、數(shù)據(jù)的錄入2、數(shù)據(jù)的排序3、數(shù)據(jù)的分組4、數(shù)據(jù)透視分析5、常用統(tǒng)計圖表的繪制三、統(tǒng)計函數(shù)頻數(shù)分布函數(shù)(FREQUENCY)的語法形式為:FREQUENCY(data_array,bins_array)其中:Data_array為用來編制頻數(shù)分布的數(shù)據(jù),Bins_array為頻數(shù)或次數(shù)的接收區(qū)間。四、實驗步驟:1、數(shù)據(jù)的錄入數(shù)據(jù)的錄入是指把調(diào)查得到的結(jié)果輸入到
2、一張叫數(shù)據(jù)清單的EXCEL工作表中。數(shù)據(jù)清單是指包含相關(guān)數(shù)據(jù)的一系列工作表的數(shù)據(jù)行,如發(fā)貨單數(shù)據(jù)庫,或一組客戶名稱和聯(lián)系電話。數(shù)據(jù)清單可以作為數(shù)據(jù)庫使用,其中行表示記錄,列表示字段。例某集團公司欲在某地區(qū)投資于醫(yī)療衛(wèi)生事業(yè),為了減少風(fēng)險,獲得利潤,該集團企劃部門決定先了解一下市場潛力。企劃部王經(jīng)理隨機訪問了該地區(qū)幾家醫(yī)院中就醫(yī)的36名患者,詢問其等候看病的時間,根據(jù)這些數(shù)據(jù),王經(jīng)理會得到什么信息呢?打開EXCEL工作表,在列中輸入數(shù)據(jù)的名稱,稱為變量。然后依次輸入相應(yīng)調(diào)查數(shù)據(jù)。2、數(shù)據(jù)的排序①打
3、開“數(shù)據(jù)整理.xls”工作簿,選定“等候時間”工作表。②利用鼠標(biāo)選定單元格A1:B37區(qū)域③在菜單中選擇“數(shù)據(jù)”中的“排序”選項,則彈出排序?qū)υ捒颉"茉谂判驅(qū)υ捒虼翱谥?,選擇“主要關(guān)鍵字”列表中的“等候時間”作為排序關(guān)鍵字,并選擇按“遞增”排序。由于所選取數(shù)據(jù)中已經(jīng)包含標(biāo)題,所以在“當(dāng)前數(shù)據(jù)清單”中選擇“有標(biāo)題行”,然后單擊“確定”按鈕,即可得到排序的結(jié)果。在數(shù)據(jù)清單中使用分類匯總的方法如下:先選擇需要分類匯總的數(shù)據(jù)區(qū)域A1:B37,然后選擇“數(shù)據(jù)”菜單中的“分類匯總”選項,則打開“分類匯總”對
4、話框。在“分類字段”的下拉式列表中選擇要進行分類的列標(biāo)題,在“匯總方式”的下拉式列表中選擇行匯總的方式,本例中選擇按“等候時間”進行分類,選擇按“計數(shù)”進行匯總,單擊“確定”按鈕,便得到分類匯總的結(jié)果。在對數(shù)據(jù)進行了分類匯總之后,可以觀察到等候時間為1分鐘的人次為1,等候時間為3分鐘的人次為2等等。盡管分類匯總可以給出各個數(shù)值所出現(xiàn)的次數(shù),但從這些次數(shù)中還是無法得出其數(shù)據(jù)分布的規(guī)律性。這是因為沒有將數(shù)值相近的數(shù)據(jù)進行合并,因而不能理想地抽象概括現(xiàn)象的數(shù)量特征。3、數(shù)據(jù)的分組利用Excel頻數(shù)分布
5、函數(shù)進行分組建立頻數(shù)分布的步驟為:先對數(shù)據(jù)進行排序,以了解全部數(shù)據(jù)的變動范圍;然后選擇全部數(shù)據(jù)的分組組數(shù);再確定分組的組限,最后對各組數(shù)值所出現(xiàn)的頻數(shù)進行計數(shù)。①打開“數(shù)據(jù)整理.xls”工作簿,選擇“等候時間”工作表。②在單元格C2中輸入“分組”,在單元格D2中輸入“頻數(shù)”。③在C3:C8區(qū)域中依次輸入10,20,30,40,50,60,作為頻數(shù)接受區(qū)域,它們分別表明等時間在10分鐘以下的人數(shù),等候時間在10分鐘以上,20分鐘以下的人數(shù)等。④選定D3:D8區(qū)域,在“插入”菜單中單擊“函數(shù)”選項,
6、打開“粘貼函數(shù)”對話框⑤在“函數(shù)分類”列表中選擇“統(tǒng)計”,在“函數(shù)名”列表中選擇“FREQUENCY”,單擊“確定”按鈕,Excel彈出“頻數(shù)分布”對話窗口。⑥在數(shù)據(jù)區(qū)域“Data_array”中輸入單元格B2:B37,在數(shù)據(jù)接受區(qū)間Bins_array中輸入單元格C3:C8,在對話窗口中可以看到其相應(yīng)的頻數(shù)是6,7,9,8,5,1,0。⑦由于頻數(shù)分布是數(shù)組操作,所以,此處不能直接單擊“確定”按鈕,而應(yīng)按Ctrl+Shift組合鍵,同時敲“回車”鍵,得到頻數(shù)分布。練習(xí)1:某生活小區(qū)80戶居民家庭
7、人口數(shù)情況:44232334323423335233233433234322335443215142233442331523321421233321431243322123在EXCEL中將上述資料錄入,并按照家庭人口數(shù)進行頻數(shù)統(tǒng)計。其次,EXCEL除能進行單變量值(單項分組)的頻數(shù)統(tǒng)計外,還可以進行組距分組的頻數(shù)統(tǒng)計。EXCEL的組距分組的頻數(shù)統(tǒng)計與單項分組的頻數(shù)統(tǒng)計操作過程大體相同。但在分組時應(yīng)注意:EXCEL的FREQUENCY函數(shù)進行頻數(shù)統(tǒng)計時采用的是“上限在內(nèi)”原則,為符合統(tǒng)計分組的“上
8、限不在內(nèi)”的原則,因此,分組時相鄰組的組限不應(yīng)重合。例:某生產(chǎn)車間50名工人日加工零件數(shù)(單位:個)如下。(數(shù)據(jù)學(xué)生自行錄入)117122124129139107117130122125108131125117122133126122118108110118123126133134127123118112112134127123119113120123127135137114120128124115139128124121擬對工人生產(chǎn)數(shù)據(jù)進行如圖1-1的C4:C9的組距分組。但是,F(xiàn)REQUEN