資源描述:
《淺析網(wǎng)絡(luò)信息檢索的方法—搜索引擎》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在工程資料-天天文庫。
1、淺析網(wǎng)絡(luò)信息檢索的方法—搜索引擎(XX圖書館,XX400037)
摘要:文章對網(wǎng)絡(luò)信息檢索方法——搜索引擎的原理、類型、特點(diǎn)及檢索方式和檢索技術(shù)進(jìn)行了分析,重點(diǎn)對搜索引擎作了評價(jià)。
關(guān)鍵詞:網(wǎng)絡(luò)信息;檢索;搜索引擎
中圖分類號:G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號:1007—6921(XX)18—0149—02
Internet的發(fā)展形成了一個(gè)巨大的全球化信息空間,其大容量、異構(gòu)性、分布性和動(dòng)態(tài)性給信息檢索帶來了挑戰(zhàn),快速獲取所需信息是用戶面臨的重大問題。搜索引擎可以解決這個(gè)問題。本文
2、介紹一種信息檢索方法—搜索引擎。
1搜索引擎的概念及原理
搜索引擎是在因特網(wǎng)/萬維網(wǎng)上進(jìn)行信息搜索、分析、索引、檢索與服務(wù)的信息檢索系統(tǒng)。
作為一種因特網(wǎng)上信息檢索系統(tǒng),搜索引擎的基本原理是:使用Robot來遍歷因特網(wǎng),將Web上分布的信息下載到本地文檔庫,然后對文檔內(nèi)容進(jìn)行自動(dòng)分析并建立以詞為單位的倒排文件。對于用戶提出的查詢提問,搜索引擎通過索引查找出匹配的文檔或鏈接,根據(jù)檢索詞在每篇文章或網(wǎng)頁中出現(xiàn)的頻率,對包含這些檢索詞的文檔和網(wǎng)頁進(jìn)行排序,最后輸出排序的結(jié)果。
2搜索引擎基本
3、類型及特點(diǎn)
2.1以分類目錄為主的搜索引擎
分類目錄搜索引擎又稱為目錄服務(wù),著名的Yahoo就是其代表。搜索引擎系統(tǒng)將搜索到的Internet資源按主題分為若干大類,每個(gè)大類下又分設(shè)二級類目、三級類目等,一些搜索引擎可細(xì)分十幾級類目。
以分類目錄為主的搜索引擎的特點(diǎn)是由系統(tǒng)先將搜索到的網(wǎng)絡(luò)信息分別歸類。這一工作有的系統(tǒng)由人工操作、有的則有機(jī)器自動(dòng)完成,只要遵循該系統(tǒng)的分類體系按圖索驥、層層深入即可。這與圖書館中傳統(tǒng)得分類索引的功能十分相似。
2.2以全文檢索為主的搜索引擎
全文
4、檢索搜索引擎通常稱為索引服務(wù),它們與分類目錄為主的搜索引擎中的網(wǎng)站查詢功能相似,但有著本質(zhì)的區(qū)別,著名的AltaVista就是這方面的代表。
以全文檢索為主的搜索引擎的特點(diǎn)是信息量特別大,在理論上可以對Internet所有網(wǎng)站的每一頁內(nèi)容進(jìn)行檢索。當(dāng)想對某一特定的主題進(jìn)行深入細(xì)致的研究時(shí),不妨借助于這類搜索引擎。
2.3多元搜索引擎
Internet龐大的信息,使得任何孤立的搜索引擎都無法單獨(dú)覆蓋,而建立在搜索引擎之上的搜索引擎,通常稱之為多元搜索引擎。由于它可以調(diào)用其他搜索引擎,從而在一定
5、程度上能夠滿足更多、更快地獲得網(wǎng)絡(luò)信息的要求。
當(dāng)向一個(gè)多元搜索引擎發(fā)出檢索要求之后,該引擎會(huì)將檢索要求迅速發(fā)送給其他獨(dú)立的搜索引擎,并將他們反饋的結(jié)果集中顯示。多元搜索引擎具有同時(shí)查詢多個(gè)數(shù)據(jù)庫的優(yōu)勢,至于其本身是否擁有數(shù)據(jù)庫則無關(guān)緊要。多元搜索引擎可分為串行處理和并行處理兩種。
目前,較有影響的多元搜索引擎有MetaCrawler,SavvySearch,SearchSpanniel等。
2.4All-in-One集成搜索
All-in-One集成搜索是指只要通過一個(gè)網(wǎng)站,即
6、可選擇多個(gè)搜索引擎依次進(jìn)行搜索。這與多元搜索引擎的工作方式有些相似,只是多元搜索引擎只要一次性輸入檢索要求,就可以同時(shí)讓多個(gè)搜索引擎一起或分別進(jìn)行搜索,并對搜索結(jié)果進(jìn)行分析整理;而All-in-One通常是逐一輸入檢索要求,然后從搜索引擎列表中每次選擇一個(gè)進(jìn)行檢索,一般不對搜索結(jié)果進(jìn)行處理。
2.5特殊用途的搜索引擎
一般人們所說的搜索引擎,總是指綜合性搜索引擎,它們通常涵蓋了各個(gè)學(xué)科的各個(gè)方面。但也有些搜索引擎,它們是專為某一特殊用途或某一特定目標(biāo)而設(shè)立的,人們將其稱為特殊用途的搜索引擎。如科
7、學(xué)信息的搜索引擎Scirus,全球華人尋人搜索引擎——Look4U,軟件搜索引擎——SOFTSeek和DownloadPowerSearch,圖形、圖象搜索引擎——lmageSurfer,支持自然語言的搜索引擎——AskJeeves等。這些專業(yè)的搜索引擎,由于其鮮明的特色和對專業(yè)的精通,往往更受歡迎。
3搜索引擎的檢索方式及檢索技術(shù)
3.1檢索方式
搜索引擎是目前Internet對信息資源進(jìn)行組織的主要方式。搜索引擎一般設(shè)有簡單檢索與高級檢索兩種檢索方式。簡單檢索就是在關(guān)鍵詞檢索框中輸入一個(gè)或
8、幾個(gè)關(guān)鍵詞,然后遞交系統(tǒng)進(jìn)行檢索,簡單檢索的結(jié)果往往不盡如人意,因?yàn)槿绻@些單詞的使用頻率較高,則反饋的信息就有可能多得讓人無法應(yīng)付;而如果這些單詞于“冷僻”,則反饋的信息又往往令人大失所望。
就搜索引擎而言,簡單檢索與高級檢索往往并沒有十分明確的界限。有的搜索引擎整體水平較高,不但其高級檢索具備了許多復(fù)雜的功能,就連其簡單檢索所包含的一般功能都超過了普通搜索引擎的高級檢索功能。
3.2檢索技術(shù)
搜索引擎的檢索