資源描述:
《key-value數(shù)據(jù)庫上連接操作查詢處理和優(yōu)化》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、AThesisinComputerArchitectureQueryProcessingandOptimizationofJoinOperationonKey—ValueDatabaseByWangXiteSupervisor:ProfessorShenDerongNortheasternUniversityJune2011>獨(dú)創(chuàng)性聲明本人聲明所呈交的學(xué)位論文是在導(dǎo)師的指導(dǎo)下完成的。論文中取得的研究成果除加以標(biāo)注和致謝的地方外,不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果,也不包括本人為獲得其他學(xué)位而使用過的材料。與我一同工作的同志對(duì)本研究所做的任何貢獻(xiàn)均已在論文中作了明確的說
2、明并表示誠摯的謝意。學(xué)位論文作者簽名:孟,習(xí)柏Et期:加7fl/,y7學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者和指導(dǎo)教師完全了解東北大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī)定:即學(xué)校有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交論文的復(fù)印件和磁盤,允許論文被查閱和借閱。本人同意東北大學(xué)可以將學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索、交流。作者和導(dǎo)師同意網(wǎng)上交流的時(shí)間為作者獲得學(xué)位后:半年口一年√一年半口兩年口學(xué)位論文作者簽名:互目糯簽字日期:沙f『、莎,77導(dǎo)師簽名:簽字日期:\審哆箏l卜烈l。6。胡f東北大學(xué)碩士學(xué)位論文摘要Key.Value數(shù)據(jù)庫上連接操作的查詢處理與優(yōu)化摘要伴隨著互聯(lián)網(wǎng)
3、技術(shù)的高速發(fā)展,各種類型的應(yīng)用層出不窮,在這個(gè)云計(jì)算的大環(huán)境下,數(shù)據(jù)存儲(chǔ)技術(shù)出現(xiàn)了新的特點(diǎn):支持海量的數(shù)據(jù)和流量,更低的讀寫延遲,強(qiáng)大的可用性,較低的運(yùn)營成本等。在過去的幾十年中,傳統(tǒng)數(shù)據(jù)庫雖然已經(jīng)在業(yè)界占據(jù)了不可動(dòng)搖的地位,但是面對(duì)時(shí)代的新需求,其擴(kuò)展困難,讀寫慢,成本高,支撐容量有限等缺點(diǎn)不斷顯現(xiàn)出來。為了解決上述問題,NoSQL數(shù)據(jù)庫應(yīng)運(yùn)而生。這類數(shù)據(jù)庫在設(shè)計(jì)支持海量的存儲(chǔ),具有強(qiáng)大的可用性,并且可以運(yùn)行在普通的PC機(jī)構(gòu)建的集群中,運(yùn)營成本低,易維護(hù)。因?yàn)橐话愣疾捎胟ey.value的數(shù)據(jù)模型。所以習(xí)慣上又稱key.valuedatabase,即KVDB。在key.
4、value數(shù)據(jù)庫中,元組之間并沒有傳統(tǒng)數(shù)據(jù)庫中的強(qiáng)關(guān)聯(lián)關(guān)系。這使得在key—value數(shù)據(jù)庫中的SQL查詢變得很難實(shí)現(xiàn),而其中最為復(fù)雜的部分就是連接操作。針對(duì)此問題,本文通過對(duì)目前較為流行的一款環(huán)形KVDB:Cassandra進(jìn)行分析,設(shè)計(jì)了針對(duì)環(huán)形架構(gòu)列值索引,并基于這種索引提出了支持大數(shù)據(jù)量的預(yù)連接操作的查詢處理算法,并做了相應(yīng)的優(yōu)化。另外作為補(bǔ)充,同時(shí)也設(shè)計(jì)了實(shí)時(shí)連接算法。本文的內(nèi)容總結(jié)如下:1.首先介紹了NoSQL中的常見數(shù)據(jù)模型、架構(gòu)和讀寫策略等相關(guān)知識(shí)。2.針對(duì)環(huán)形架構(gòu)設(shè)計(jì)了相應(yīng)的列值索引,給出了相關(guān)算法。并基于這種索引結(jié)構(gòu),設(shè)計(jì)并優(yōu)化了預(yù)連接算法。3.設(shè)計(jì)了
5、實(shí)時(shí)連接算法。同時(shí)針對(duì)實(shí)時(shí)連接算法,設(shè)計(jì)了雙重索引,提高了實(shí)時(shí)連接算法的效率。4.針對(duì)本文提出的算法進(jìn)行了實(shí)驗(yàn)測(cè)試,驗(yàn)證了算法的性能。關(guān)鍵詞:NoSQL,KVDB,連接操作,查詢處理與優(yōu)化II東北大學(xué)碩士學(xué)位論文AbstractQueryProcessingandOptimizationofJoinOperationonKey-ValueDatabaseAbstractWiththerapiddevelopmentofInternettechnology,varioustypesofapplicationsemergeoneafteranother.Inthebackgr
6、oundofcloud-computing,datastoragetechnologybecometohavesomenewfeatures:supportingextremelylargeamountsofdata,lowerIOdelay,highavailability,loweroperationandmaintenancecosts.etc.Inthepastfewdecades,traditionalrelationaldatabasehasalreadyoccupiedunshakablestatusinindustry,butitsdrawbacksuch
7、aslowexpansibility,highcost,literacyslow,supportingcapacitylimitbecomemoreandmoreserious.Inordertosolvetheproblemsabove,NoSQLdatabasearisesatthehistoricmoment.Thiskindofdatabaseisdesignedtosupporthugeamountsofdatastorage,hashighavailability,canrunontheclusterwhichis