資源描述:
《deep+web信息自動搜索方法的研究》由會員上傳分享,免費在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫。
1、中文摘要隨著互聯(lián)網(wǎng)的不斷發(fā)展,人們可以從中獲得越來越多有價值的信息,并且這些信息的數(shù)量仍在迅速的增長。按照信息的“深度”,可將互聯(lián)網(wǎng)分為DeepWeb和Surfacew曲。相對于SurfaceWeb,DeepWeb中的信息數(shù)量更大、結(jié)構(gòu)化程度更高、專業(yè)性更強,也因此具有更高的價值。目前,DeepWeb相關(guān)的問題己成為W曲領(lǐng)域研究的熱點。DeepWeb信息的自動化獲取是其中非常重要的一個問題,因為雖然有大量的信息分布于DeepWeb,但傳統(tǒng)搜索引擎由于其自身的技術(shù)障礙無法獲取,通過手工方式獲取不但效率低下且成本高昂;此外,沒有DeepWeb信息的自動化
2、獲取,后續(xù)的信息抽取等工作也很難體現(xiàn)出價值。由此可見,DeepWeb信息自動化獲取技術(shù)的研究至關(guān)重要。本文提出了一種基于XML和Web信息抽取技術(shù)的、針對特定領(lǐng)域DeepWeb信息的自動化搜索方法。利用該方法能夠?qū)崿F(xiàn)對某一領(lǐng)域多個DeepWeb信息源的自動化搜索,并且可以靈活擴展信息源的數(shù)量。本文介紹了該方法的理論模型與系統(tǒng)實現(xiàn),并對該方法的應(yīng)用及實驗結(jié)果進行了總結(jié)與評價。關(guān)鍵字信息搜索、DeepWeb、XML、信息抽取AbstractWiththedevelopmentoftheinteract,peoplecangetmoreandmoreuse
3、fulinformationfromit.Theamountoftheinformation,however,isalsogrowingfast.Accordingtotheinformationdepth,thewebcanbedividedintoDeepWebandSurfaceWeb.ComparedwithSurfaceWeb.theinformationinDeepWjbismuchlarger,morestructural,moreprofessionalandmorevaluable.Currently,subjectsrelated
4、toDeepⅥ,ebhavebecomehotfocusonwebresearchfield.AutomaticDeepw曲informationsearchtechnologyisoneimportantsubjectofthem.AlthoughthereismassiveinformationdistributedinDeepW曲.traditionalsearchenginescan’tobtainthemduetotheirtechnicallimits;themanualcrawlingwayisveryinefficientandexp
5、ensive.Furthermore,withoutautomaticinformationsearchtechnology,thelaterwork,suchasinformationextraction,wouldlosetheirvalue.Therefore.researchonautomaticDeepW曲informationsearchtechnologyiscritical.Inthispaper,weproposeanautomaticDomain-SpecificDeepWebsearchmethodbasedonXMLandWe
6、bInformationExtractiontechnology.InthiswaywecanfetchDeepW曲informationfrommulti·websitesautomaticallyandexpandthenumberofDeepW曲websiteseasilyThispaperalsoillustratesthetheoreticmodelandimplementationoftheproposedinformationsearchsystem.Furthermore,thepapergivesasummarizationande
7、valuationontheexperimentalresults.KeywordInformationSearch、DeepWeb,XML,InformationExtractionII內(nèi)容目錄圖目錄圖2.1手動操作模式下的DeepWeb信息訪問過程圖2.2查詢請求自動分派模型..7..91011圖2.3DeepWeb搜索引擎工作過程圖2.4DeepWeb查詢接口示例圖2.5查詢信息轉(zhuǎn)換模型?????????????????..13圖2.6公有配置文件結(jié)構(gòu)圖2.7專有配置文件結(jié)構(gòu)圖圖2.8查詢屬性提取.樹結(jié)構(gòu)模型圖2.9查詢屬性提取一表格結(jié)構(gòu)模型圖
8、2.10查詢屬性匹配模型圖2.11查詢參數(shù)結(jié)構(gòu)圖圖2.12查詢參數(shù)構(gòu)造流程圖3.1系統(tǒng)流程圖圖3.2查詢接口