資源描述:
《一種基于糾刪碼分布式備份技術的研究》由會員上傳分享,免費在線閱讀,更多相關內容在學術論文-天天文庫。
1、AThesisSubmittedinPartialFulfillmentoftheRequirementsfortheDegreeofMasterofEngineeringAResearchoftheBackupTechnologyBasedonErasureCodeinDistributedStorageSystemCandidate:BiWenjuanMajor:ComputerArchitectureSupervisor:Prof.XieChangshengHuazhongUniversityofScienceandTechnologyWuhan,Hubei430074,P.R.Chi
2、naJanuary,2013獨創(chuàng)性聲明本人聲明所呈交的學位論文是我個人在導師指導下進行的研究工作及取得的研究成果。盡我所知,除文中已經標明引用的內容外,本論文不包含任何其他個人或集體已經發(fā)表或撰寫過的研究成果。對本文的研究做出貢獻的個人和集體,均已在文中以明確方式標明。本人完全意識到本聲明的法律結果由本人承擔。學位論文作者簽名:日期:年月日學位論文版權使用授權書本學位論文作者完全了解學校有關保留、使用學位論文的規(guī)定,即:學校有權保留并向國家有關部門或機構送交論文的復印件和電子版,允許論文被查閱和借閱。本人授權華中科技大學可以將本學位論文的全部或部分內容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮
3、印或掃描等復制手段保存和匯編本學位論文。保密□,在年解密后適用本授權書。本論文屬于不保密□。(請在以上方框內打“√”)學位論文作者簽名:指導教師簽名:日期:年月日日期:年月日華中科技大學碩士學位論文摘要隨著互聯(lián)網技術和信息技術的不斷發(fā)展,存儲系統(tǒng)中的數(shù)據(jù)量不斷增長并呈海量形式發(fā)展。傳統(tǒng)的依賴本地服務器的存儲已經無法滿足日益增長的存儲需求,因此大規(guī)模的基于分布式存儲的數(shù)據(jù)中心正在迅速增長。分布式存儲系統(tǒng)中,為了保障數(shù)據(jù)的可用性,容災備份是關鍵問題之一,這需要使用容錯策略來實現(xiàn)系統(tǒng)的高可靠性,特別是存在大量的冷數(shù)據(jù)的分布式存儲系統(tǒng)中,冷數(shù)據(jù)的備份方式需要特別考慮。針對上述問題,在介紹備份容錯策略
4、的基礎上,對分布式系統(tǒng)的編碼備份技術進行了分析和研究,并提出了一種基于編碼的分布式備份方案。通過對現(xiàn)有編碼技術的研究,提出了一種基于糾刪碼的,適用于含大量冷數(shù)據(jù)分布式系統(tǒng)的一種備份架構。這種架構在保障數(shù)據(jù)可靠性的同時,能夠提高系統(tǒng)的存儲利用率,提高系統(tǒng)的負載均衡性,縮短節(jié)點失效時的修復時間,增加系統(tǒng)靈活性。在系統(tǒng)設計上,為了使系統(tǒng)的負載更為均衡,將存儲節(jié)點中的物理節(jié)點根據(jù)需求分為多個虛擬節(jié)點并且排序后均勻分布在圓環(huán)結構中,虛擬節(jié)點存儲用戶數(shù)據(jù)。同時,根據(jù)用戶需求設計不同的備份服務器,選擇存儲組,存儲組由多個不在同一物理節(jié)點的虛擬節(jié)點構成,備份服務器中的數(shù)據(jù)經過分割,糾刪碼編碼后,分散存儲到存
5、儲組內的虛擬節(jié)點上,不同的用戶需求可以選擇不同的糾刪碼。處理失效時,數(shù)據(jù)塊通過解碼的方式恢復來保證其可靠性,物理節(jié)點通過多存儲組的并行恢復在保證可靠性的同時,縮短恢復時間?;谠O計的模型,對基于糾刪碼的分布式備份方案進行了仿真測試,通過節(jié)點選取和數(shù)據(jù)修復的測試,驗證了編碼備份方案能保證數(shù)據(jù)的可靠性,相較于三副本方案,存儲利用率提高36%,較非并行的編碼方案,修復時間更短。在測試過程中主要采用了CRS和RS碼兩種糾刪碼進行測試,測試表明CRS碼的編解碼效率比RS碼更好,恢復能達到高效率。關鍵詞:分布式存儲系統(tǒng),糾刪碼,備份,里德所羅門碼I華中科技大學碩士學位論文AbstractWiththed
6、evelopmentofInternetandinformationtechnology,thenumberofdataisgrowingexponentially.Facinggrowingdatapressure,thetraditionalstoragetechnologythatdependedonthelocalserverstoragehasbeenunabletosatisfythegrowingdemandofdata,soalotofdatacentersbasedondistributedstoragesystemaregrowingrapidly.Inordertoen
7、suretheavailabilityofdataindistributedstoragesystem,disastertoleranceisoneofthekeyproblems.Itneedstouseavarietyoffaulttolerantstrategiestoachievethehighreliability;especiallythedistributedstoragesystemconta