deep+web信息自動搜索方法的研究

deep+web信息自動搜索方法的研究

ID:32057891

大?。?.33 MB

頁數(shù):58頁

時間:2019-01-31

deep+web信息自動搜索方法的研究_第1頁
deep+web信息自動搜索方法的研究_第2頁
deep+web信息自動搜索方法的研究_第3頁
deep+web信息自動搜索方法的研究_第4頁
deep+web信息自動搜索方法的研究_第5頁
資源描述:

《deep+web信息自動搜索方法的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、中文摘要隨著互聯(lián)網(wǎng)的不斷發(fā)展,人們可以從中獲得越來越多有價值的信息,并且這些信息的數(shù)量仍在迅速的增長。按照信息的“深度”,可將互聯(lián)網(wǎng)分為DeepWeb和Surfacew曲。相對于SurfaceWeb,DeepWeb中的信息數(shù)量更大、結(jié)構(gòu)化程度更高、專業(yè)性更強,也因此具有更高的價值。目前,DeepWeb相關(guān)的問題己成為W曲領(lǐng)域研究的熱點。DeepWeb信息的自動化獲取是其中非常重要的一個問題,因為雖然有大量的信息分布于DeepWeb,但傳統(tǒng)搜索引擎由于其自身的技術(shù)障礙無法獲取,通過手工方式獲取不但效率低下且成本高昂;此外,沒有DeepWeb信息的自動化

2、獲取,后續(xù)的信息抽取等工作也很難體現(xiàn)出價值。由此可見,DeepWeb信息自動化獲取技術(shù)的研究至關(guān)重要。本文提出了一種基于XML和Web信息抽取技術(shù)的、針對特定領(lǐng)域DeepWeb信息的自動化搜索方法。利用該方法能夠?qū)崿F(xiàn)對某一領(lǐng)域多個DeepWeb信息源的自動化搜索,并且可以靈活擴展信息源的數(shù)量。本文介紹了該方法的理論模型與系統(tǒng)實現(xiàn),并對該方法的應(yīng)用及實驗結(jié)果進行了總結(jié)與評價。關(guān)鍵字信息搜索、DeepWeb、XML、信息抽取AbstractWiththedevelopmentoftheinteract,peoplecangetmoreandmoreuse

3、fulinformationfromit.Theamountoftheinformation,however,isalsogrowingfast.Accordingtotheinformationdepth,thewebcanbedividedintoDeepWebandSurfaceWeb.ComparedwithSurfaceWeb.theinformationinDeepWjbismuchlarger,morestructural,moreprofessionalandmorevaluable.Currently,subjectsrelated

4、toDeepⅥ,ebhavebecomehotfocusonwebresearchfield.AutomaticDeepw曲informationsearchtechnologyisoneimportantsubjectofthem.AlthoughthereismassiveinformationdistributedinDeepW曲.traditionalsearchenginescan’tobtainthemduetotheirtechnicallimits;themanualcrawlingwayisveryinefficientandexp

5、ensive.Furthermore,withoutautomaticinformationsearchtechnology,thelaterwork,suchasinformationextraction,wouldlosetheirvalue.Therefore.researchonautomaticDeepW曲informationsearchtechnologyiscritical.Inthispaper,weproposeanautomaticDomain-SpecificDeepWebsearchmethodbasedonXMLandWe

6、bInformationExtractiontechnology.InthiswaywecanfetchDeepW曲informationfrommulti·websitesautomaticallyandexpandthenumberofDeepW曲websiteseasilyThispaperalsoillustratesthetheoreticmodelandimplementationoftheproposedinformationsearchsystem.Furthermore,thepapergivesasummarizationande

7、valuationontheexperimentalresults.KeywordInformationSearch、DeepWeb,XML,InformationExtractionII內(nèi)容目錄圖目錄圖2.1手動操作模式下的DeepWeb信息訪問過程圖2.2查詢請求自動分派模型..7..91011圖2.3DeepWeb搜索引擎工作過程圖2.4DeepWeb查詢接口示例圖2.5查詢信息轉(zhuǎn)換模型?????????????????..13圖2.6公有配置文件結(jié)構(gòu)圖2.7專有配置文件結(jié)構(gòu)圖圖2.8查詢屬性提取.樹結(jié)構(gòu)模型圖2.9查詢屬性提取一表格結(jié)構(gòu)模型圖

8、2.10查詢屬性匹配模型圖2.11查詢參數(shù)結(jié)構(gòu)圖圖2.12查詢參數(shù)構(gòu)造流程圖3.1系統(tǒng)流程圖圖3.2查詢接口

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。