deep+web信息自動搜索方法的研究

ID：32057891

大?。?.33 MB

頁數(shù)：58頁

時間：2019-01-31

資源描述：

《deep+web信息自動搜索方法的研究》由會員上傳分享，免費在線閱讀，更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。

1、中文摘要隨著互聯(lián)網(wǎng)的不斷發(fā)展，人們可以從中獲得越來越多有價值的信息，并且這些信息的數(shù)量仍在迅速的增長。按照信息的“深度”，可將互聯(lián)網(wǎng)分為DeepWeb和Surfacew曲。相對于SurfaceWeb，DeepWeb中的信息數(shù)量更大、結(jié)構(gòu)化程度更高、專業(yè)性更強，也因此具有更高的價值。目前，DeepWeb相關(guān)的問題己成為W曲領(lǐng)域研究的熱點。DeepWeb信息的自動化獲取是其中非常重要的一個問題，因為雖然有大量的信息分布于DeepWeb，但傳統(tǒng)搜索引擎由于其自身的技術(shù)障礙無法獲取，通過手工方式獲取不但效率低下且成本高昂；此外，沒有DeepWeb信息的自動化

2、獲取，后續(xù)的信息抽取等工作也很難體現(xiàn)出價值。由此可見，DeepWeb信息自動化獲取技術(shù)的研究至關(guān)重要。本文提出了一種基于XML和Web信息抽取技術(shù)的、針對特定領(lǐng)域DeepWeb信息的自動化搜索方法。利用該方法能夠?qū)崿F(xiàn)對某一領(lǐng)域多個DeepWeb信息源的自動化搜索，并且可以靈活擴展信息源的數(shù)量。本文介紹了該方法的理論模型與系統(tǒng)實現(xiàn)，并對該方法的應(yīng)用及實驗結(jié)果進行了總結(jié)與評價。關(guān)鍵字信息搜索、DeepWeb、XML、信息抽取AbstractWiththedevelopmentoftheinteract，peoplecangetmoreandmoreuse

3、fulinformationfromit．Theamountoftheinformation，however,isalsogrowingfast．Accordingtotheinformationdepth，thewebcanbedividedintoDeepWebandSurfaceWeb．ComparedwithSurfaceWeb．theinformationinDeepWjbismuchlarger,morestructural，moreprofessionalandmorevaluable．Currently,subjectsrelated

4、toDeepⅥ，ebhavebecomehotfocusonwebresearchfield．AutomaticDeepw曲informationsearchtechnologyisoneimportantsubjectofthem．AlthoughthereismassiveinformationdistributedinDeepW曲．traditionalsearchenginescan’tobtainthemduetotheirtechnicallimits；themanualcrawlingwayisveryinefficientandexp

5、ensive．Furthermore，withoutautomaticinformationsearchtechnology,thelaterwork，suchasinformationextraction，wouldlosetheirvalue．Therefore．researchonautomaticDeepW曲informationsearchtechnologyiscritical．Inthispaper,weproposeanautomaticDomain-SpecificDeepWebsearchmethodbasedonXMLandWe

6、bInformationExtractiontechnology．InthiswaywecanfetchDeepW曲informationfrommulti·websitesautomaticallyandexpandthenumberofDeepW曲websiteseasilyThispaperalsoillustratesthetheoreticmodelandimplementationoftheproposedinformationsearchsystem．Furthermore，thepapergivesasummarizationande

7、valuationontheexperimentalresults．KeywordInformationSearch、DeepWeb，XML，InformationExtractionII內(nèi)容目錄圖目錄圖2．1手動操作模式下的DeepWeb信息訪問過程圖2．2查詢請求自動分派模型．．7．．91011圖2．3DeepWeb搜索引擎工作過程圖2．4DeepWeb查詢接口示例圖2．5查詢信息轉(zhuǎn)換模型?????????????????．．13圖2．6公有配置文件結(jié)構(gòu)圖2．7專有配置文件結(jié)構(gòu)圖圖2．8查詢屬性提取．樹結(jié)構(gòu)模型圖2．9查詢屬性提取一表格結(jié)構(gòu)模型圖

8、2．10查詢屬性匹配模型圖2．11查詢參數(shù)結(jié)構(gòu)圖圖2．12查詢參數(shù)構(gòu)造流程圖3．1系統(tǒng)流程圖圖3．2查詢接口

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

侵權(quán)申訴



1 1 2 3 4 5 / 58



此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁，下載文檔查看全文

版權(quán)提示
下載文檔

溫馨提示：
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件，查看預(yù)覽時可能會顯示錯亂或異常，文件下載后無此問題，請放心下載。
2. 本文檔由用戶上傳，版權(quán)歸屬用戶，天天文庫負責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容，確認文檔內(nèi)容符合您的需求后進行下載，若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤，付費完成后未能成功下載的用戶請聯(lián)系客服處理。

deep+web信息自動搜索方法的研究

deep+web信息自動搜索方法的研究

相關(guān)文章

相關(guān)標簽