搜索引擎及其使用

搜索引擎及其使用

ID:39426418

大?。?32.00 KB

頁(yè)數(shù):19頁(yè)

時(shí)間:2019-07-03

搜索引擎及其使用_第1頁(yè)
搜索引擎及其使用_第2頁(yè)
搜索引擎及其使用_第3頁(yè)
搜索引擎及其使用_第4頁(yè)
搜索引擎及其使用_第5頁(yè)
資源描述:

《搜索引擎及其使用》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。

1、第二章搜索引擎及其使用2.1搜索引擎概述2.1.1搜索引擎的發(fā)展過(guò)程搜索引擎的發(fā)展過(guò)程及其發(fā)展趨勢(shì)。(★★領(lǐng)會(huì))P.31經(jīng)歷了4個(gè)階段22.1.2搜索引擎的概念搜索引擎的廣義和狹義定義。(★識(shí)記)從狹義的角度來(lái)說(shuō),搜索引擎是指對(duì)WWW站點(diǎn)資源和其他網(wǎng)絡(luò)資源進(jìn)行標(biāo)引和檢索的一類(lèi)檢索系統(tǒng)機(jī)制,由信息收集軟件、索引數(shù)據(jù)庫(kù)和查詢(xún)接口三部分組成。 從廣義的角度上講,搜索引擎是因特網(wǎng)的一類(lèi)網(wǎng)站,是在Web中主動(dòng)搜索信息(搜索網(wǎng)頁(yè)上有意義的單詞和簡(jiǎn)短的對(duì)特定內(nèi)容的描述的詞)并將其自動(dòng)標(biāo)引的Web網(wǎng)站以及標(biāo)引的內(nèi)容儲(chǔ)存在可供檢索的大型數(shù)據(jù)庫(kù)中,并

2、建立相應(yīng)的索引和目錄服務(wù),從而對(duì)用戶(hù)提出的各種檢索做出響應(yīng),提供用戶(hù)所需的信息或相關(guān)的指針。32.1.3搜索引擎的類(lèi)型搜索引擎的各種類(lèi)型。(★識(shí)記)1)按搜索機(jī)制劃分,分為:關(guān)鍵詞型、目錄型和混合型。2)按搜索內(nèi)容劃分,分為:綜合型、專(zhuān)業(yè)型和特殊型。3)按包含搜索工具的數(shù)量劃分,分為:?jiǎn)为?dú)型和集成型。目錄式搜索引擎和關(guān)鍵詞型搜索引擎在查準(zhǔn)率和查全率方面的不同之處。(★★領(lǐng)會(huì))關(guān)鍵詞型搜索引擎查全率高,查準(zhǔn)率低;目錄搜索引擎查準(zhǔn)率高,查全率低。42.1.4搜索引擎提供的服務(wù)搜索引擎提供的服務(wù)。(★★領(lǐng)會(huì))目前搜索引擎提供的主要檢索服

3、務(wù)有以下幾類(lèi): 目錄檢索;全文檢索;精確檢索;自然語(yǔ)言檢索;多語(yǔ)種檢索;媒體檢索;過(guò)濾檢索;智能檢索;檢索結(jié)果修正;檢索結(jié)果排序;提供最新收錄的新帖。52.2搜索引擎工作原理與關(guān)鍵技術(shù)2.2.1搜索引擎的工作流程搜索引擎的工作流程及其組成部分。(★識(shí)記)在因特網(wǎng)中發(fā)現(xiàn)、搜集網(wǎng)頁(yè)信息對(duì)信息進(jìn)行提取和組織,建立索引庫(kù)根據(jù)用戶(hù)輸入的查詢(xún)條件,在索引庫(kù)中快速檢出文檔,進(jìn)行文檔與查詢(xún)的相關(guān)度評(píng)價(jià),對(duì)將要輸出的結(jié)果進(jìn)行排序,并將查詢(xún)結(jié)果返回給用戶(hù)信息搜集系統(tǒng)索引數(shù)據(jù)庫(kù)查詢(xún)接口搜索引擎的工作流程搜索引擎的組成62.2.2信息搜集技術(shù)信息搜集系統(tǒng)

4、是通過(guò)網(wǎng)絡(luò)機(jī)器人來(lái)自動(dòng)完成的,不需要任何的人工處理。網(wǎng)絡(luò)機(jī)器人:一個(gè)在網(wǎng)絡(luò)上檢索文件且自動(dòng)跟蹤該文件的超文本結(jié)構(gòu)并循環(huán)檢索被參照的所有文件的軟件。網(wǎng)絡(luò)機(jī)器人的工作流程及其搜索策略。(★識(shí)記) (1)機(jī)器人的工作流程:①機(jī)器人從起始URL列表中取出URL并從網(wǎng)上讀取其指向的內(nèi)容。 ②從每一個(gè)文檔中提取某些信息,如關(guān)鍵字或整個(gè)網(wǎng)頁(yè),標(biāo)引完這些檢索點(diǎn)上的新文檔后將其加入到索引數(shù)據(jù)庫(kù)并組成倒排文檔。7③從文檔中提取指向其他文檔的URL,并加入到URL列表中。 ④重復(fù)上述3個(gè)步驟,直到再?zèng)]有新的URL出現(xiàn)或超出了某些限制(時(shí)間或磁盤(pán)空間)

5、⑤給索引數(shù)據(jù)庫(kù)加上檢索接口,向網(wǎng)上用戶(hù)發(fā)布或提供給用戶(hù)檢索。(2)機(jī)器人的搜索策略:機(jī)器人的搜索策略用來(lái)解決當(dāng)機(jī)器人程序搜索到一個(gè)文檔后,下一步應(yīng)該轉(zhuǎn)移到哪一個(gè)文檔的問(wèn)題。 ①深度優(yōu)先搜索策略。②廣度優(yōu)先搜索策略。 ③IP地址搜索策略。 ④深度和廣度結(jié)合的搜索策略。82.2.3索引技術(shù)索引技術(shù)的3種類(lèi)型:(★識(shí)記)自動(dòng)索引、手工索引和用戶(hù)登錄三類(lèi)。索引的4種類(lèi)型:(★識(shí)記)(1)目錄索引 (2)文本索引或關(guān)鍵詞索引 (3)鏈索引 (4)站點(diǎn)索引92.2.4檢索器與結(jié)果處理技術(shù)檢索器提供的查詢(xún)接口形式: 目錄導(dǎo)航式搜索引擎可提供兩種

6、查詢(xún)接口形式:目錄和關(guān)鍵詞檢索。 網(wǎng)頁(yè)搜索引擎一般只提供關(guān)鍵詞檢索。支持基本檢索外,還支持高級(jí)檢索。檢索結(jié)果的處理技術(shù)(★識(shí)記)可歸納為: ①按頻次排定次序 ②按頁(yè)面被訪(fǎng)問(wèn)度排序 ③二次檢索102.3搜索引擎的評(píng)價(jià)與使用技巧2.3.1搜索引擎的評(píng)價(jià)搜索引擎的評(píng)價(jià)體系的各組成部分的內(nèi)容(★識(shí)記)P.41-42根據(jù)搜索引擎的性能評(píng)價(jià)體系標(biāo)準(zhǔn)來(lái)評(píng)價(jià)一個(gè)搜索引擎(如Yahoo,新浪,百度,Google)(★★★應(yīng)用)2.3.2搜索引擎的使用技巧搜索引擎的使用技巧(★識(shí)記)(1)熟悉經(jīng)常使用的查詢(xún)工具及其特性是搜索成功的基礎(chǔ) (2)確定使用

7、哪一類(lèi)搜索引擎,這是信息檢索關(guān)鍵的一步11(3)關(guān)鍵字的選擇是運(yùn)用搜索引擎成功的重要因素 (4)仔細(xì)研究該搜索引擎使用說(shuō)明,能夠極大地提高搜索效率,節(jié)省時(shí)間 (5)使用操作符改善檢索過(guò)程 (6)打開(kāi)多個(gè)窗口,進(jìn)行多種嘗試 (7)要經(jīng)常監(jiān)控WWW站點(diǎn)上各個(gè)主要搜索引擎的排名情況122.4常用搜索引擎及其使用Yahoo、新浪、百度、Google的搜索方式及其搜索常用運(yùn)算符。(★★★應(yīng)用)2.4.1Yahoo!及其使用搜索方式:普通搜索和高級(jí)搜索兩種方式。Yahoo!提供的操作符: ①“”,查詢(xún)完全符合雙引號(hào)中的關(guān)鍵字符串的。如:“ut

8、ilitytheory”②+,限定該關(guān)鍵詞一定要出現(xiàn)在結(jié)果中。如:computer+technology③-,表示邏輯非操作,限定“-”后面的關(guān)鍵字串一定不要出現(xiàn)在結(jié)果中。如:computer-software13④intitle:,在檢索詞前面加

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。