資源描述:
《《虛擬化與云計(jì)算》模擬試卷》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、《虛擬化與云計(jì)算》模擬試卷姓名:學(xué)號(hào):院系:第一部分:選擇題(共40分,每題4分)1)Reducer的三個(gè)階段是()A.Shuffle——Sort——ReduceB.Shuffle——Reduce——SortC.Reduce——Shuffle——SortD.Sort——Shuffle——Reduce2)下列關(guān)于mapreduce的key/value對(duì)的說(shuō)法正確的是()A.輸入鍵值對(duì)不需要和輸出鍵值對(duì)類型一致B.輸入的key類型必須和輸出的key類型一致C.輸入的value類型必須和輸出的value類型一致D.輸入鍵值對(duì)只能映射成一個(gè)輸出鍵值對(duì)3)下面哪一個(gè)選項(xiàng)是mapreduce真正的引擎()
2、A.NamenodeB.DatanodeC.JobTrackerandTaskTrackerD.HDFS4)下列選項(xiàng)中哪個(gè)不是GFS中“Masters”的主要功能()A.維護(hù)所有文件系統(tǒng)的元數(shù)據(jù)B.周期性地與chunkservers聯(lián)系來(lái)發(fā)送指令和檢查狀態(tài)C.對(duì)于讀與寫(xiě),客戶端通過(guò)與Master聯(lián)系來(lái)獲得chunk的位置,然后直接與chunkservers連接D.返回最終的答案給客戶端5)下列哪個(gè)選項(xiàng)不是我們需要Hive的主要原因()A.我們需要一個(gè)容量為PB級(jí)別的數(shù)據(jù)倉(cāng)庫(kù)。B.文件是不充分的數(shù)據(jù)抽象。C.Hadoop在處理作業(yè)方面是不夠的。D.我們需要一個(gè)開(kāi)發(fā)的數(shù)據(jù)格式。6)下面那個(gè)不是云計(jì)
3、算的特征()A.虛擬化B.動(dòng)態(tài)可擴(kuò)展C.管理多設(shè)備D.個(gè)體自治7)Hadoop用來(lái)確保數(shù)據(jù)準(zhǔn)確性的方法不包括下面的哪一個(gè)()A.使用校驗(yàn)和來(lái)驗(yàn)證數(shù)據(jù)4B.客戶端每512字節(jié)計(jì)算一次校驗(yàn)和,數(shù)據(jù)節(jié)點(diǎn)存儲(chǔ)這些校驗(yàn)和C.客戶端從數(shù)據(jù)節(jié)點(diǎn)中檢索數(shù)據(jù),如果驗(yàn)證失敗,客戶嘗試別的副本D.數(shù)據(jù)節(jié)點(diǎn)中的數(shù)據(jù)被加密以防止可能的攻擊8)關(guān)于分布式文件系統(tǒng)的說(shuō)法,不正確的是()A.分布式文件系統(tǒng)整個(gè)集群中有多個(gè)namespaceB.文件被分為大的塊,通常為128MC.可以通過(guò)Java、C或者命令行訪問(wèn)D.非常適合對(duì)大文件的流式讀取9)以下錯(cuò)誤不是Hadoop能很好解決的()A.任務(wù)失敗B.任務(wù)追蹤失敗C.連接失敗D
4、.作業(yè)追蹤失敗10)下列哪個(gè)選項(xiàng)能正確地在Hive中返回“查詢年齡在18到25歲之間的用戶返回的前5頁(yè)”的結(jié)果()A.SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspON(u.name=p.user)WHEREu.age>=18ANDu.age<=25GROUPBYp.urlORDERBYclicksLIMIT5;B.SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspWHEREu.age>=18ANDu.age<=25GROUPBYp.urlORDERBYclicksLIMIT5;
5、C.SELECTp.url,COUNT(1)asclicksFROMpage_viewspON(u.name=p.user)ORDERBYclicksLIMIT5;D.SELECTp.url,COUNT(1)asclicksFROMusersuJOINpage_viewspON(u.name=p.user)WHEREu.age>=18ANDu.age<=25GROUPBYp.urlORDERBYclicks;4第二部分:簡(jiǎn)答題(共60分,第一大題10分,第二大題20分,第三大題30分)一、簡(jiǎn)述MapReduce的主要思想和工作原理(可借助下面的例子),并根據(jù)例子畫(huà)出數(shù)據(jù)流圖(例子:使用MapR
6、educe解決求商品價(jià)格最小問(wèn)題,輸入為商品名稱、商品價(jià)格、商品網(wǎng)站,輸出為商品名稱、最小價(jià)格、商品網(wǎng)站。輸入樣例:Cloudcomputing38.4dangdang.comCloudcomputing40.5china-pub.comVirtualizationandcloudcomputing35.7amazon.com.cnVirtualizationandcloudcomputing30.8bookschina.comVirtualizationandcloudcomputing36.6360buy.comCloudcomputing35.1amazon.com.cn輸出樣例:Clo
7、udcomputing35.1amazon.com.cnVirtualizationandcloudcomputing30.8bookschina.com)二、當(dāng)數(shù)據(jù)量非常大超過(guò)單個(gè)機(jī)器的存儲(chǔ)能力時(shí)需要將數(shù)據(jù)存儲(chǔ)在不同的機(jī)器上,這時(shí)就需要分布式文件系統(tǒng)來(lái)管理這些數(shù)據(jù),請(qǐng)回答關(guān)于分布式文件系統(tǒng)的下列問(wèn)題:(1).在設(shè)計(jì)分布式文件系統(tǒng)時(shí)需要注意哪些方面?(2).原先存儲(chǔ)超大文件的分布式文件系統(tǒng)現(xiàn)用來(lái)存