資源描述:
《網(wǎng)絡(luò)環(huán)境下的信息資源檢索策略及其應(yīng)用》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。
1、網(wǎng)絡(luò)環(huán)境下的信息資源檢索策略及其應(yīng)用[]:因特X上的信息資源,是指以數(shù)字形式記錄,以多媒體形式表達(dá),存貯在X絡(luò)計(jì)算機(jī)磁介質(zhì)、光介質(zhì)及各類通信介質(zhì)上的信息集合。對(duì)X絡(luò)信息資源及其檢索進(jìn)行必要的研究,有助于人們快速準(zhǔn)確地獲取X上有用信息,推動(dòng)社會(huì)信息化與信息社會(huì)化的雙向發(fā)展。因此本文闡述了X絡(luò)環(huán)境下的信息資源檢索策略及其應(yīng)用。[關(guān)鍵詞]:X絡(luò)環(huán)境,信息檢索,信息過(guò)濾,文本挖掘一、引言21世紀(jì)是一個(gè)高度信息化的社會(huì),信息就是生產(chǎn)力,在各個(gè)行業(yè)信息化發(fā)展的同時(shí),人們對(duì)信息檢索的完備、準(zhǔn)確、快捷會(huì)有更嚴(yán)格的要求和期望。作為文獻(xiàn)信息中心的圖書館也迎來(lái)了一個(gè)全新的信息環(huán)境,豐富的X絡(luò)信息資源為圖書館的信
2、息服務(wù)提供了廣泛的資源基礎(chǔ),使X絡(luò)環(huán)境下的信息資源檢索策略發(fā)生了重大的變化。二、X絡(luò)信息的特點(diǎn)(一)數(shù)量巨大而龐雜。Inter是一個(gè)基于TCP/IP協(xié)議連接世界各國(guó)數(shù)以百萬(wàn)計(jì)算機(jī)X絡(luò)的通訊X,是一個(gè)集各種信息資源為一體的信息資源X。政府、機(jī)構(gòu)、企業(yè)、個(gè)人等都可以在X上發(fā)布信息,因此它己成為無(wú)所不包的龐雜信息源,并具有跨地區(qū)、分布廣、多語(yǔ)種、高度資源共享的特點(diǎn)。(二)內(nèi)容范圍廣泛。X上的信息源幾乎涵蓋了人類知識(shí)的全部領(lǐng)域,既有人文科學(xué)、社會(huì)科學(xué)、自然科學(xué)、工程技術(shù)信息,也有大量生活服務(wù)、娛樂(lè)消遣等方面的信息。(三)信息類型豐富。其主要形式有X絡(luò)出版,包括電子、X上圖書、電子工具書等;各種動(dòng)態(tài)
3、信息主要包括新聞、廣告、股市行情、天氣、交通、會(huì)議等;還有大量的書目數(shù)據(jù)庫(kù)、聯(lián)機(jī)數(shù)據(jù)庫(kù)、軟件資源以及個(gè)人主頁(yè)、電子郵件等。這些信息都是數(shù)字式、多媒體,既有文本的信息,也有大量的圖形、圖像、音頻、視頻信息。(四)動(dòng)態(tài)性強(qiáng)。X上信息具有高度動(dòng)態(tài)性,各種信息處在不斷生產(chǎn)、更新淘汰的狀態(tài),同時(shí)連接在一起的各X絡(luò)、X站、X頁(yè)都時(shí)時(shí)刻刻在變化。X絡(luò)信息還具有交互式特點(diǎn),如BBS、聊天、游戲等。(五)信息組織特殊、控制性差。因特X上信息的組織以超文本技術(shù)鏈接,構(gòu)成立體X狀文獻(xiàn)鏈,把不同國(guó)家地區(qū)、不同服務(wù)器、各種X頁(yè)、各類不同文獻(xiàn)的相關(guān)信息都通過(guò)節(jié)點(diǎn)鏈接起來(lái),使得檢索相關(guān)文獻(xiàn)、相關(guān)信息非常方便,加強(qiáng)了信息
4、間的關(guān)聯(lián)度,形成了一個(gè)X狀結(jié)構(gòu)。(六)有序與無(wú)序,集中與分散并存?;ヂ?lián)X上的信息沒(méi)有統(tǒng)一控制,雖然從局部來(lái)說(shuō)某個(gè)X站、某個(gè)數(shù)據(jù)庫(kù)是有控制的、相對(duì)集中的、有序和規(guī)范的,但總的來(lái)說(shuō)互聯(lián)X的信息沒(méi)有統(tǒng)一的控制,信息質(zhì)量良蕎不齊,信息也處于分散、無(wú)序、不規(guī)范的狀態(tài)之中。三、X絡(luò)環(huán)境下的信息資源檢索策略及其應(yīng)用科學(xué)技術(shù)的日新月異和用戶需求的不斷提高促使X絡(luò)檢索工具相應(yīng)發(fā)展,X絡(luò)環(huán)境下的信息資源檢索策略及其應(yīng)用可以分為以下幾個(gè)方面:(一)信息過(guò)濾技術(shù)及其應(yīng)用Inter開放式的環(huán)境,為人們檢索和利用信息提供了極大的方便,但同時(shí),X絡(luò)環(huán)境也為人們及時(shí)準(zhǔn)確地檢索到所需信息帶來(lái)了麻煩。信息過(guò)濾技術(shù)就是在這樣的
5、背景下開始受到人們的重視,它的目的就是讓搜索引擎具有更多的“智力”,讓搜索引擎能夠更加深入、更加細(xì)致地參與到用戶的整個(gè)檢索過(guò)程中,從關(guān)鍵詞的選擇、檢索范圍的確定到檢索結(jié)果的精煉,幫助用戶在浩如煙海的信息中找到和需求真正相關(guān)的資料。在用戶的檢索過(guò)程中,信息過(guò)濾可以通過(guò)多種途徑實(shí)現(xiàn)。第一,關(guān)鍵詞的選擇。當(dāng)用戶要檢索不太熟悉的領(lǐng)域時(shí),系統(tǒng)可以通過(guò)提供機(jī)讀類詞表的方法方便用戶選詞,也可以通過(guò)后控詞表等方法自動(dòng)擴(kuò)大或縮小(通常是通過(guò)近義詞表擴(kuò)大)檢索范圍,提高查全率和查準(zhǔn)率;第二,利用過(guò)濾模型。過(guò)濾模型是目前Inter上信息過(guò)濾主要方法,它是通過(guò)設(shè)計(jì)過(guò)濾軟件并附加到X絡(luò)信息檢索的程序中以增加過(guò)濾功能
6、。這主要表現(xiàn)在兩個(gè)方面,一方面,搜索程序在進(jìn)行信息搜索時(shí)可通過(guò)過(guò)濾功能過(guò)濾掉一些認(rèn)為價(jià)值不大或沒(méi)有價(jià)值的信息;另一方面,用戶也可根據(jù)自己的需求選擇服務(wù)項(xiàng)目與內(nèi)容,通過(guò)過(guò)濾機(jī)制快速找到所需的信息資源。其方法是根據(jù)需求設(shè)置過(guò)濾條件,如不希望獲取的、某類主題的內(nèi)容、某種類型或范圍的信息等,程序在運(yùn)行時(shí)一旦觸發(fā)條件,則可將有關(guān)信息刪除或拒之門外,而其他信息仍可輸入。(二)文本挖掘技術(shù)及其運(yùn)用文本挖掘是知識(shí)管理研究領(lǐng)域的新興分支之一,為文本信息的整理、分析、挖掘提供了有效的手段。傳統(tǒng)的信息檢索或信息訪問(wèn),主要根據(jù)用戶提供的查詢條件從文檔數(shù)據(jù)庫(kù)中檢索出相關(guān)的文檔信息。為了提高信息訪問(wèn)的準(zhǔn)確性,檢索系統(tǒng)
7、增加了相關(guān)處理,如文檔分類、自動(dòng)文摘、主題詞自動(dòng)抽取等方法,使用戶能夠方便查找到所需信息。在文本挖掘處理中,大多采用神經(jīng)X絡(luò)模型描述文本及文檔數(shù)據(jù)庫(kù)各概念之間,以及概念和文檔之間、文檔與文檔之間的相互關(guān)系在信息檢索中,無(wú)須分析文檔中概念之間的相互關(guān)系,只要依據(jù)用戶的查詢,返回相關(guān)文檔集合。但是,文本挖掘不僅能夠區(qū)分不同的概念,還能夠分析不同概念結(jié)點(diǎn)之間的相互關(guān)聯(lián)關(guān)系。1、文本內(nèi)容挖掘在檢索中的應(yīng)用。文本內(nèi)容挖掘是指從文檔