資源描述:
《網(wǎng)絡(luò)信息資源教程》由會(huì)員上傳分享,免費(fèi)在線(xiàn)閱讀,更多相關(guān)內(nèi)容在行業(yè)資料-天天文庫(kù)。
1、第三章信息檢索基礎(chǔ)1信息檢索概述2信息檢索語(yǔ)言3信息檢索的方法與步驟1信息檢索概述1.1信息檢索的概念1.2信息檢索的發(fā)展1.3信息檢索的分類(lèi)1.1信息檢索的概念1950年,美國(guó)數(shù)學(xué)家莫爾斯首次提出“信息檢索”一詞。他認(rèn)為:信息檢索是一種時(shí)間性的通訊形式。其后,隨著信息檢索理論和實(shí)踐的更新發(fā)展,人們對(duì)信息檢索的認(rèn)識(shí)也在不斷深入。實(shí)際上,信息檢索具有廣義和狹義兩種含義。廣義上的信息檢索是指將信息按照一定的方式組織和存儲(chǔ)起來(lái),并根據(jù)信息用戶(hù)的需要找出有關(guān)信息的過(guò)程。狹義上的信息檢索是指從信息集合中找出所需信息的過(guò)程,相當(dāng)
2、于信息查詢(xún)。1.2信息檢索的發(fā)展公元前6年,我國(guó)西漢時(shí)期的古文經(jīng)學(xué)家、目錄學(xué)家劉歆根據(jù)當(dāng)時(shí)的國(guó)家藏書(shū),編制了我國(guó)第一部綜合性的系統(tǒng)目錄《七略》,這也是我國(guó)最早的第一部圖書(shū)分類(lèi)法。但信息檢索作為一個(gè)學(xué)科來(lái)發(fā)展始于19世紀(jì)下半葉。至20世紀(jì)40年代,索引和檢索已經(jīng)成為圖書(shū)館獨(dú)立的工具和用戶(hù)服務(wù)項(xiàng)目。具體來(lái)看,信息檢索的發(fā)展可分為以下三個(gè)階段:第一階段——手工信息檢索階段手工信息檢索發(fā)展于19世紀(jì)末,這個(gè)階段的信息檢索手段主要利用的是書(shū)本式和卡片式,包括檢索型和資料型的工具書(shū)等幫助讀者查找圖書(shū)、期刊或現(xiàn)成答案。第二階段——
3、機(jī)械信息檢索階段機(jī)械信息檢索的發(fā)展期是20世紀(jì)40~50年代,生命周期很短暫,是手工檢索到計(jì)算機(jī)信息檢索的過(guò)渡階段。機(jī)械信息檢索主要包括兩種檢索手段:(1)穿孔卡片信息檢索系統(tǒng)使用諸如打孔機(jī)、驗(yàn)孔機(jī)、分類(lèi)機(jī)等機(jī)電設(shè)備記錄二次文獻(xiàn),用電刷作為檢索元件的信息檢索系統(tǒng)。(2)縮微制品信息檢索系統(tǒng)使用縮微照相記錄二次文獻(xiàn),以膠卷或膠片邊緣部分若干黑白小方塊的組合做檢索標(biāo)志,利用光電檢索元件查找文獻(xiàn)的系統(tǒng)。第三階段——計(jì)算機(jī)信息檢索階段隨著1946年世界上第一臺(tái)電子計(jì)算機(jī)的問(wèn)世,計(jì)算機(jī)技術(shù)逐步走進(jìn)信息檢索領(lǐng)域,并與信息檢索理論
4、緊密結(jié)合起來(lái),脫機(jī)批量情報(bào)檢索系統(tǒng)、聯(lián)機(jī)實(shí)時(shí)情報(bào)檢索系統(tǒng)相繼研制成功并商業(yè)化。1954年美國(guó)海軍兵器中心圖書(shū)館利用IBM701機(jī)開(kāi)發(fā)計(jì)算機(jī)信息檢索系統(tǒng),它標(biāo)志著計(jì)算機(jī)信息檢索階段的開(kāi)始。計(jì)算機(jī)信息檢索可分為以下4個(gè)發(fā)展階段:(1)脫機(jī)檢索20世紀(jì)50~60年代是脫機(jī)檢索的試驗(yàn)和實(shí)用化階段。批處理檢索是這個(gè)階段信息檢索的主要方式。這一階段的數(shù)據(jù)存取與數(shù)據(jù)通信能力都比較差。(2)聯(lián)機(jī)檢索20世紀(jì)60~80年代是聯(lián)機(jī)檢索試驗(yàn)和實(shí)用化階段。這個(gè)階段的特點(diǎn)是聯(lián)機(jī)數(shù)據(jù)庫(kù)集中管理,具有完備的數(shù)據(jù)庫(kù)聯(lián)機(jī)檢索功能,但其數(shù)據(jù)通信能力仍然
5、比較差。(3)光盤(pán)檢索光盤(pán)檢索階段始于20世紀(jì)80年代中期。這個(gè)階段比較特殊。在發(fā)達(dá)國(guó)家,光盤(pán)檢索是聯(lián)機(jī)檢索的支持和補(bǔ)充,但在通信技術(shù)不太發(fā)達(dá)的國(guó)家,由于它自身的優(yōu)點(diǎn),卻是用戶(hù)獲取信息的一個(gè)十分重要的手段。(4)網(wǎng)絡(luò)檢索網(wǎng)絡(luò)檢索開(kāi)始于20世紀(jì)90年代初,以Internet的出現(xiàn)為標(biāo)志,檢索系統(tǒng)大多采用分布式的網(wǎng)絡(luò)化管理。該階段的信息資源發(fā)生了變化,從普通的文獻(xiàn)轉(zhuǎn)化為數(shù)字形式、多媒體的文獻(xiàn)。信息檢索的用戶(hù)也由原來(lái)的情報(bào)專(zhuān)業(yè)人員擴(kuò)展到包括商務(wù)人員、管理人員、教師學(xué)生、各專(zhuān)業(yè)人士在內(nèi)的普通大眾,他們對(duì)信息檢索從結(jié)果到方式提
6、出了更高、更多樣化的要求。適應(yīng)網(wǎng)絡(luò)化、智能化以及個(gè)性化的需要是目前信息檢索技術(shù)發(fā)展的新趨勢(shì)。1.3信息檢索的分類(lèi)人們?cè)谏鐣?huì)實(shí)踐中,根據(jù)工作、學(xué)習(xí)、科學(xué)研究的不同需要所進(jìn)行的信息檢索,大體上可以歸納為四類(lèi):1、文獻(xiàn)檢索其檢索結(jié)果是文獻(xiàn)資料,包括有關(guān)文獻(xiàn)的出處、收藏單位等。文獻(xiàn)檢索主要是通過(guò)文獻(xiàn)檢索工具進(jìn)行的,如書(shū)目、索引、題錄、文摘等。2、數(shù)據(jù)檢索其結(jié)果為數(shù)據(jù),包括公式、圖表、分子式等。3、事實(shí)檢索其結(jié)果為事實(shí)結(jié)論,包括事物、事件的性質(zhì)、定義、原理及發(fā)生的時(shí)間、地點(diǎn)、過(guò)程等。事實(shí)與數(shù)據(jù)檢索是信息檢索的派生檢索,但又是大
7、量的、日常的、有具體對(duì)象的檢索。如查字或詞,查人物,查機(jī)構(gòu)名稱(chēng)和縮寫(xiě),查地名,查年代日期等等,這些事實(shí)和數(shù)據(jù)是一種確定性的信息檢索,檢索結(jié)果具有唯一性。4、圖象、聲音檢索例如查找老北京、老上海的照片,查看南京的民國(guó)時(shí)期建筑圖片,了解孫中山先生作過(guò)的演說(shuō)錄音等,利用多媒體技術(shù)處理、檢索聲像信息,使圖象、聲音檢索更為快捷。2信息檢索語(yǔ)言2.1信息檢索語(yǔ)言的概念2.2信息檢索語(yǔ)言的類(lèi)型2.1信息檢索語(yǔ)言的概念信息檢索語(yǔ)言是一種專(zhuān)門(mén)的人工語(yǔ)言,又稱(chēng)標(biāo)引語(yǔ)言和索引語(yǔ)言,是信息系統(tǒng)中用以描述信息的內(nèi)容及外表特征和檢索者表達(dá)檢索提
8、問(wèn)的語(yǔ)言,是兩者相互溝通的共同依據(jù),是用于信息標(biāo)引和檢索提問(wèn)的約定語(yǔ)言。標(biāo)引人員可以用檢索語(yǔ)言來(lái)標(biāo)引文獻(xiàn),以便將文獻(xiàn)進(jìn)行整理,加工,存儲(chǔ)于檢索系統(tǒng)中。同時(shí),檢索人員也可以用檢索語(yǔ)言來(lái)表達(dá)信息檢索課題的內(nèi)容,以便把特定文獻(xiàn)從檢索系統(tǒng)中檢索出來(lái)。因此,檢索語(yǔ)言是一種把文獻(xiàn)的存儲(chǔ)與檢索聯(lián)系起來(lái),把標(biāo)引人員和檢索人員溝通起來(lái)的人工語(yǔ)言。檢索語(yǔ)言的功能與