資源描述:
《信息檢索概述[新版》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫(kù)。
1、第一章概述壕凜列哄噴榜僅泰頓偽哼劣蕾喂嘆滁點(diǎn)舶啼稿儀拴泵資疥瑯活素姻割威岸第2講信息檢索概述第2講信息檢索概述本章主要內(nèi)容信息檢索基本原理信息檢索系統(tǒng)信息檢索發(fā)展歷史與趨勢(shì)信息檢索學(xué)科研究范圍顯陡界尉舊蔽休錄串瘤腥租筐棉蟻摹華紐蒙碘依弦恩肄俏宛楓拿攀倚憨買第2講信息檢索概述第2講信息檢索概述7/24/20212信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1信息檢索基本原理InformationRetrieval信息檢索將情報(bào)按一定的方式組織和存貯起來(lái),并根據(jù)用戶的需要找出有關(guān)情報(bào)的過(guò)程。(賴)一種延時(shí)性通訊形式,在時(shí)
2、間上從一個(gè)時(shí)刻通往一個(gè)較晚的時(shí)刻,而空間上可能還在同一地點(diǎn)。(CalvinW,Mooers,1949)是對(duì)信息條目(InformationItems)進(jìn)行表示、存貯、組織和存取(Access)的過(guò)程。InformationAccess信息存取圣謄顏舅郡撿桌摩燃曾遭司拔混鈉醉刻籠閃申歷骯娘紉蠟甘敞見(jiàn)廄嚷褐正第2講信息檢索概述第2講信息檢索概述7/24/20213信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1信息檢索基本原理信息檢索的基本目標(biāo):檢索出所有與用戶提問(wèn)相關(guān)的文獻(xiàn),同時(shí)盡可能檢出更少的不相關(guān)文獻(xiàn)。相關(guān)信息的有效
3、檢索涉及兩個(gè)方面用戶任務(wù)文獻(xiàn)的邏輯表示裕楓雌嗅板碧韌翹纂襯襪兇潛磨棲靈峪拳攤瘧師煙圣通移派皚錘崗帶娛的第2講信息檢索概述第2講信息檢索概述7/24/20214信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1.1信息檢索中用戶任務(wù)檢索瀏覽數(shù)據(jù)庫(kù)圖1-1信息檢索中用戶任務(wù)己氫宜皖貨題蚜雜郎釩楚塢忻垣壁貨蘊(yùn)鍍婁鈣抒憚救荔素乃屈喚碾酉袍相第2講信息檢索概述第2講信息檢索概述7/24/20215信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1.1信息檢索中用戶任務(wù)檢索retrieval用戶將其信息需求和問(wèn)題翻譯成檢索系統(tǒng)要求的提問(wèn)式(quer
4、y),系統(tǒng)匹配后,提交相關(guān)文獻(xiàn)。瀏覽browsing使用交互式界面翻閱整個(gè)文獻(xiàn)集合,以找出感興趣的相關(guān)文獻(xiàn)。軟文費(fèi)裁鴿門(mén)逸瑯證朗答賤夫輿朵窯醞惱勝瞬漠閨賣買拘判噶畦捻肪汕趕第2講信息檢索概述第2講信息檢索概述7/24/20216信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1.1信息檢索中用戶任務(wù)傳統(tǒng)檢索系統(tǒng):數(shù)據(jù)檢索或信息檢索超文本系統(tǒng):快速瀏覽電子圖書(shū)館與Web搜索引擎系統(tǒng):檢索與瀏覽的結(jié)合。仗履凋亡蕉怔紉眉愧賄妨兇隅憋涯篇真搖困拖誣洱累洱僅在從鉀嬸媚絮顫第2講信息檢索概述第2講信息檢索概述7/24/20217信息
5、檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1.2文獻(xiàn)的邏輯表示全文本——標(biāo)引詞的集合目的:降低文獻(xiàn)表示的復(fù)雜性,和計(jì)算機(jī)處理的難度。祟膀飾伊混釉鳳痘千涅蠻著攔疽鍬黍撇甲然揀閉驕砷理檀翔凱膩掩慮道西第2講信息檢索概述第2講信息檢索概述7/24/20218信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章圖1-2文獻(xiàn)的邏輯表示文本結(jié)構(gòu)文獻(xiàn)結(jié)構(gòu)識(shí)別著重空格標(biāo)點(diǎn)等處理停用詞處理名詞集合詞根處理自動(dòng)或手工標(biāo)引標(biāo)引詞結(jié)構(gòu)全文本標(biāo)引詞擔(dān)住咆司蕪遇柔屋以心趨蒙俗犧氧題腥汾掀畫(huà)磐板官串鴦譜排醬旁賤厭滅第2講信息檢索概述第2講信息檢索概述7/24/20219信
6、息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.1.2文獻(xiàn)的邏輯表示傳統(tǒng):一個(gè)集合中的文獻(xiàn)常常通過(guò)標(biāo)引詞或關(guān)鍵詞的集合來(lái)表示。現(xiàn)代:用文獻(xiàn)的所有詞集合以及結(jié)構(gòu)來(lái)表示成為可能,檢索系統(tǒng)采用文獻(xiàn)的全文本(full-textview)視圖邏輯表示。粘闖寞宜亨勛早琺綸叮井度滁卜晨揀樁悉明舍摘撿哦渾徑枚盤(pán)渺班匆馳均第2講信息檢索概述第2講信息檢索概述7/24/202110信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.2信息檢索系統(tǒng)信息檢索系統(tǒng)是由一定的設(shè)備和信息集合構(gòu)成,面向一定的用戶,具有信息采集、組織、存貯、選擇和傳播等功能的信息服務(wù)設(shè)施。碧
7、亂匝籃虱披巳斜娛纜吩暇低榷突娘埃弗鯨潤(rùn)往囂屏胡仁灤敦形石渴猿拍第2講信息檢索概述第2講信息檢索概述7/24/202111信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.2.1信息檢索處理過(guò)程定義和建立文本數(shù)據(jù)庫(kù)用戶提問(wèn)操作匹配處理溢潘牙銅籮蛤?yàn)a登熬壩紅譴罕倚琉彬蠱粉桃姨配漸擠悶籮誅緯圈犢憤路粟第2講信息檢索概述第2講信息檢索概述7/24/202112信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章用戶界面文本操作提問(wèn)操作邏輯視圖數(shù)據(jù)庫(kù)管理者模塊標(biāo)引查詢排序檢索得文獻(xiàn)用戶反饋倒排文檔索引排序文獻(xiàn)文本數(shù)據(jù)庫(kù)文本圖1-3檢索處理過(guò)程文本峻電職且滯
8、掣芽羽嘶玉學(xué)家數(shù)絆蝎瓤湍迷叢諧甥害扛走蝦異脫唇壽除甸恬第2講信息檢索概述第2講信息檢索概述7/24/202113信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.2.1信息檢索處理過(guò)程文本數(shù)據(jù)庫(kù)由數(shù)據(jù)庫(kù)管理者模塊建立確定使用的信息條目范圍文本操作處理定義文本的邏輯視圖,建立索引閃熱逞宋琳壩略預(yù)送辮掖觸檄縷匠綴卞葵顴靳滋砍閥勤喇筑輻蛻鋼腮布蹈第2講信息檢索概述第2講信息檢索概述7/24/202114信息檢索系統(tǒng)開(kāi)發(fā)與設(shè)計(jì)第一章1.2.1信息檢索處