WEB日志和子空間聚類挖掘算法研究

WEB日志和子空間聚類挖掘算法研究

ID:36431762

大?。?.80 MB

頁(yè)數(shù):109頁(yè)

時(shí)間:2019-05-10

WEB日志和子空間聚類挖掘算法研究_第1頁(yè)
WEB日志和子空間聚類挖掘算法研究_第2頁(yè)
WEB日志和子空間聚類挖掘算法研究_第3頁(yè)
WEB日志和子空間聚類挖掘算法研究_第4頁(yè)
WEB日志和子空間聚類挖掘算法研究_第5頁(yè)
資源描述:

《WEB日志和子空間聚類挖掘算法研究》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、華中科技大學(xué)博士學(xué)位論文WEB日志和子空間聚類挖掘算法研究姓名:胡蓉申請(qǐng)學(xué)位級(jí)別:博士專業(yè):計(jì)算機(jī)軟件與理論指導(dǎo)教師:盧炎生20080601華中科技大學(xué)博士學(xué)位論文查詢的結(jié)果,增加結(jié)果集的可控性,提高用戶的決策效率。在分析高維數(shù)據(jù)空間的子空間Skyline查詢存在的困難的基礎(chǔ)上,設(shè)計(jì)一種新穎而緊湊的結(jié)構(gòu)—子空間Skyline簇,通過在Skyline查詢中引入聚類算法,巧妙地結(jié)合子空間Skyline查詢的優(yōu)點(diǎn)和聚類技術(shù)各自的優(yōu)點(diǎn)。在一般的Skyline查詢算法中有幾點(diǎn)要求,即漸進(jìn)性、正確性、高效性、公正性、用戶友好性和可擴(kuò)展性?;谂判虻淖涌臻gSkyl

2、ine聚類算法SSSCM和基于閾值的子空間Skyline聚類算法TSSCM利用最近鄰居點(diǎn)以及排序?qū)kyline查詢的作用,并且受到top-k查詢算法的啟發(fā),滿足Skyline查詢的這幾點(diǎn)要求。在兩個(gè)真實(shí)數(shù)據(jù)集和兩個(gè)模擬數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),結(jié)果表明這兩種算法能夠高效地返回結(jié)果,TSSCM算法的性能更優(yōu)。關(guān)鍵詞:WEB日志挖掘,查詢?cè)~翻譯,子空間聚類,樣式相似性,Skyline查詢,子空間Skyline簇II華中科技大學(xué)博士學(xué)位論文AbstractDataminingistoidentifyvalid,novel,potentiallyusefuland

3、ultimatelyunderstandablepatternsindata.Withtherapiddevelopmentofinformationtechnologies,datagainedfrommanyfieldsaregrowingexponentiallyeveryday.Especially,largescaleandcomplexdataaregeneratedinmanyapplications,suchaswebapplications,naturalscience,andelectronicbusinessetc.Howtoh

4、elpusersextractknowlegefromthesedataeffectivelyisanurgentproblemthatshouldbesolved.Thus,ithasveryimportanttheoreticalandpracticalsignificancetoconsidertheneedofapplicationsandthedatacharacteristicsofdifferentfieldstodesigneffectiveminingalgorithmsforsuchlargescaleandhighdimensi

5、onaldata.Fortheproblemofminingtranslationsofwebqueriesfromwebclick-throughdata,theframeworkMTQCleveragesweblogsasaneffectivecorpustominewebquerytranslations.Basedontheanalysisofweblogswhicharecollectedfromtheinteractioninformationbetweenwebusersandsearchengines,MTQCfullyleverag

6、esthebilingualURLpairsandqueriesrelatedtotheseURLs.Itisatwo-stepminingprocess.First,itidentifiesbilingualURLpairs,thenitmatchesquerytranslationpairs.TwoalgorithmsnamedMTQC-1andMTQC-2arebasedontheframework.Theythushavemanygoodproperties,suchasrequirenocrawlingorwordssegmentation

7、,cancapturepopulartranslations,canextractsemanticallyrelevanttranslationstoimproveCross-LingualInformationRetrieval.Theexperimentsconductedinthelargescaleandrealclick-throughdatashowthatcomparedtothestate-of-the-arttranslationalogirthms,theproposedalgorithmsareeffectiveintransl

8、atingoutofvocabularyqueriesandpopularqueries.Forthepro

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無此問題,請(qǐng)放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請(qǐng)聯(lián)系客服處理。