資源描述:
《多存儲層次能效散列連接算法》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、浙江工業(yè)大學(xué)碩士學(xué)位論文多存儲層次能效散列連接算法作者姓名:劉明超指導(dǎo)教師:楊良懷浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院2013年10月DissertationSubmittedtoZhejiangUniversityofTechnologyfortheDegreeofMasterEnergy--EfficientJoinAlgorithmsinMulti--MemoryHierarchiesCandidate:LiuMingChaoAdvisor:YangLiangHuaiCollegeofComputerScienceandTechnologyZhejiang
2、UniversityofTechnologyoct2013浙江工業(yè)大學(xué)學(xué)位論文原創(chuàng)性聲明本人鄭重聲明:所提交的學(xué)位論文是本人在導(dǎo)師的指導(dǎo)下,獨(dú)立進(jìn)行研究工作所取得的研究成果。除文中已經(jīng)加以標(biāo)注引用的內(nèi)容外,本論文不包含其他個(gè)人或集體已經(jīng)發(fā)表或撰寫過的研究成果,也不含為獲得浙江工業(yè)大學(xué)或其它教育機(jī)構(gòu)的學(xué)位證書而使用過的材料。對本文的研究作出重要貢獻(xiàn)的個(gè)人和集體,均已在文中以明確方式標(biāo)明。本人承擔(dān)本聲明的法律責(zé)任。作者簽名:辦lI淚怨日期:詵I多年/婦,多日學(xué)位論文版權(quán)使用授權(quán)書本學(xué)位論文作者完全了解學(xué)校有關(guān)保留、使用學(xué)位論文的規(guī)定,同意學(xué)校保留并向國家有關(guān)部門
3、或機(jī)構(gòu)送交論文的復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)浙江工業(yè)大學(xué)可以將本學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮印或掃描等復(fù)制手段保存和匯編本學(xué)位論文。日期:知l肄f2r月J5)日日期:扣筍Ia月’尸日浙江工業(yè)大學(xué)碩士學(xué)位論文多存儲層次能效散列連接算法摘要連接是數(shù)據(jù)庫系統(tǒng)查詢處理中的一個(gè)核心操作,高能效連接算法是能效DBMS中的一個(gè)重要研究議題。固態(tài)盤和硬盤比較具有隨機(jī)讀寫性能快的優(yōu)勢,數(shù)據(jù)庫系統(tǒng)中合理利用這一優(yōu)勢提升連接算法的能效成為可能。本文針對散列連接分區(qū)階段隨機(jī)寫嚴(yán)重的情況,分別在二存儲層次(內(nèi)存+固態(tài)盤或硬盤)和多
4、存儲層次(內(nèi)存+固態(tài)盤和硬盤)兩種情形下,提出了不同的解決方案消除隨機(jī)VO對算法性能和能效的不利影響。主要完成了以下幾方面工作:1.在數(shù)據(jù)庫存儲設(shè)備為固態(tài)盤的環(huán)境中提出了單文件的GRACE散列連接算法(SFHJ),SFHJ分區(qū)階段同一張表的所有分區(qū)存儲在一個(gè)臨時(shí)文件。該算法能利用固態(tài)盤隨機(jī)讀延遲低和順序?qū)憥捀叩膬?yōu)勢,提升連接算法性能。2.在數(shù)據(jù)庫存儲設(shè)備為硬盤的環(huán)境中,提出通過緩存優(yōu)化來減少隨機(jī)VO的緩存優(yōu)化混合散列連接算法(OHHJ),即通過合理優(yōu)化分區(qū)階段桶緩存的大小來盡量減少分區(qū)過程中產(chǎn)生的隨機(jī)VO。3.在由HDD和SSD混合的數(shù)據(jù)庫多存儲層次系統(tǒng)中
5、,結(jié)合SFHJ提出了基于硬盤和固態(tài)盤混合存儲系統(tǒng)下的組合盤GRACE散列連接算法(CGHJ)。CGHJ對GRACE散列連接算法分區(qū)階段作如下改進(jìn):將固態(tài)盤作為內(nèi)存和硬盤之間的緩存,分區(qū)階段桶緩存滿后先寫回固態(tài)盤的臨時(shí)文件;臨時(shí)文件緩存滿后,利用遷移緩存將固態(tài)盤中的數(shù)據(jù)轉(zhuǎn)移到硬盤的分區(qū)文件。同時(shí)在多存儲層次系統(tǒng)下對HHJ進(jìn)行改進(jìn),提出了CHHJ。實(shí)驗(yàn)結(jié)果表明OHHJ能效要一直好于HHJ,而SFHJ和CGHJ在特定的條件下能效也能得到較大的提升。關(guān)鍵詞:隨機(jī)I/O,固態(tài)盤,混合存儲系統(tǒng),散列連接浙江工業(yè)大學(xué)碩士學(xué)位論文Energy-·EfficientHashJ
6、oinAlgorithmsinMulti--MemoryHierarchiesABSTRACTJoinisthecoreopermionandenergy-efficientjoinalgorithmhasbeenhighlyconcernedinpower-awareDBMS.Solidstatedriver(SSD)hasafasterrandomI/Ospeedcomparedwitllharddisk,thisadvantagecanbeusedtoimproveenergy-efficiencyofjoinalgorithm.Toreduceser
7、iousrandom-writesinpartitionphaseofhashjoin,whichaffectstheperformanceandenergyefficiency,thisthesisproposessolutionsbyconsideringthedifferentmemoryhierarchies(RAM+SSDorharddisk,andRAM+SSDandHDD).Thecontributionsareasfollows:1.TheSFHJjoinalgorithmispresented,whichstoresallthepartit
8、ionsofarelmioninonetempora