資源描述:
《基于鏈接的分析pagerank排序算法改進(jìn)的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、湖北工業(yè)大學(xué)碩士學(xué)位論文摘要搜索引擎技術(shù)是在當(dāng)前各領(lǐng)域?qū)τ嬎阗Y源和計算能力不斷增長的形勢下發(fā)展起來的,而基于鏈接分析的PageRank算法的研究更是其至關(guān)重要的一個環(huán)節(jié),目的是對搜索的網(wǎng)頁進(jìn)行重要性排序,讓更符合用戶需求的網(wǎng)頁在搜索結(jié)果中靠前。由于傳統(tǒng)排序算法的局限性和客觀性,使得對于特定領(lǐng)域搜索的索引不夠完善,結(jié)果往往偏離用戶的需求,很難滿足多元化,個性化的搜索需求。而一個完善的索引系統(tǒng)應(yīng)該對特定領(lǐng)域的搜索進(jìn)行區(qū)分歸類,在原有的排序技術(shù)上,針對具體的用戶需求和資源特征來完善排序算法。探討了搜索引
2、擎及PageRank的基本概念,歸納了不同領(lǐng)域的索引的特征,分析了各種模型,建立一個綜合性較高的索引機制。詳細(xì)介紹了PageRank算法的原理,分析了現(xiàn)有鏈接分析算法的缺陷,在各種領(lǐng)域的搜索中存在的問題,并提出改進(jìn)的策略。分別描述了針對特定領(lǐng)域搜索,在傳統(tǒng)的PageRank算法上的改進(jìn)模型。逐步坦訴了基于主題相關(guān)性,信息發(fā)布時間反饋性,頁面主題分塊機制的PageRank算法改進(jìn)模型。提出了PageRank綜合改進(jìn)模型。通過與原有算法的比較分析,驗證出此算法更具時效性,內(nèi)容相關(guān)性。關(guān)鍵詞:搜索引擎,P
3、ageRank,主題相關(guān)性,時間反饋,主題分塊機制I湖北工業(yè)大學(xué)碩士學(xué)位論文AbstractSearchEnginetechnologyisdevelopedwiththesituationofgrowingcomputingresourcesandcomputingabilityinallFieldsCurrently,thealgorithmofPageRankwhichbasedonlinkanalysisistheessentialpartofit.Thepurposeofsortingth
4、ewebpageswhichhavebeensearchedbyimportanceistomakethewebpageswhichconformstheneedofuserstandinfrontoftheotherwebpages.Becauseoflimitationandobjectivityofthetraditionalsortingalgorithm,thesearchingindexisnotperfectlyinspecificfield.Sothesearchingresultu
5、suallydeviatefromtherequirementoftheuseranditisdifficulttosatisfytheneedofdiversificationandpersonalizationofsearching.Aperfectindexsystemshouldbeabletodiscriminateandclassifythespecificfieldofsearching,improvethesortingalgorithmforspecificuser’srequir
6、ementandresourcecharacteristicsintheoriginalsortingtechnologyfoundation.ThisarticlediscussesSearchEngineandbasicconceptsofPageRank,summarizesthecharacteristicsoftheindexindifferentfields,analyzesdifferentkindsofmodels,andestablishesahighcomprehensivein
7、dexingmechanism.ItdetailstheprincipleofPageRankalgorithm,analyzestheshortcomingsofexistinglinkanalysisalgorithmsandthesearchingproblemsinvariousfields,andthenproposestheimprovingstrategies.Itdescribesthesearchingforaspecificarea,theimprovedPageRankalgo
8、rithmmodelbasedontraditionalalgorithms.ItgraduallyillustrateimprovedPageRankalgorithmmodelthatbasedonTopicalRelevance,feedbackofinformationreleasetimeandpagethemesblockingmechanism.ThisarticleproposeacomprehensiveimprovementmodelofPageR