《信息檢索模型》PPT課件

《信息檢索模型》PPT課件

ID:45182287

大?。?07.00 KB

頁數(shù):82頁

時間:2019-11-10

《信息檢索模型》PPT課件_第1頁
《信息檢索模型》PPT課件_第2頁
《信息檢索模型》PPT課件_第3頁
《信息檢索模型》PPT課件_第4頁
《信息檢索模型》PPT課件_第5頁
資源描述:

《《信息檢索模型》PPT課件》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、第二章信息檢索模型Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.內(nèi)容提要信息檢索系統(tǒng)的形式化表示布爾邏輯模型向量空間模型概率模型其他檢索模型Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.什么是模型?模型是采用數(shù)學(xué)工具,對現(xiàn)實世界

2、某種事物或某種運(yùn)動的抽象描述面對相同的輸入,模型的輸出應(yīng)能夠無限地逼近現(xiàn)實世界的輸出舉例:天氣的預(yù)測模型信息檢索模型給出了文檔的表示方法,查詢的表示方式以及查詢與文檔的匹配過程Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.信息檢索模型信息檢索模型是指如何對查詢和文檔進(jìn)行表示,然后對它們進(jìn)行相似度計算的框架和方法。本質(zhì)上是對相關(guān)度建模。信息檢索模型是IR中的核心內(nèi)容之一。Evalua

3、tiononly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.信息檢索模型一個信息檢索模型是由文檔表示、查詢、關(guān)系、模型框架構(gòu)成的四元組。四元組:System=(D,Q,F,R(dj,qi))D文檔集的表示Q用戶需求的表示F文檔表示、查詢表示和他們之間關(guān)系的模型框架(Frame)R(dj,qi)給出Queryqi和Documentdj的評分Evaluationonly.CreatedwithAspose.Sl

4、idesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.文檔邏輯視圖D是一個文檔集合,通常由文檔邏輯視圖來表示。可以是一組索引詞或關(guān)鍵詞。既可以自動提取,也可以是由人主觀指定。Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.匹配處理框架(F)在信息集合(D)與需求集合(F)之間建立模型化處理的框架與規(guī)則。不同

5、檢索模型的匹配處理的數(shù)學(xué)機(jī)制是不同的。布爾模型:集合論的基本運(yùn)算向量空間模型:多維向量空間理論和向量線性代數(shù)概率模型:集合論、概率運(yùn)算和Bayes法則Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.匹配計算函數(shù)R匹配函數(shù)R(dj,q)用于計算任一信息dj(dj∈D)與任一提問q(q∈Q)形成的信息——提問對(dj,q)之間的相似度大小。一般地,R(dj,q)的函數(shù)值為一實數(shù),其取值區(qū)

6、間為[0,1]匹配函數(shù)的特點(diǎn):計算方法簡單,計算量??;函數(shù)值在取值區(qū)間均勻分布;針對某一提問所獲取的相關(guān)文檔集合,能夠?qū)崿F(xiàn)合理的排序輸出。Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.信息檢索模型決定于:從什么樣的視角去看待查詢式和文檔?基于什么樣的理論去看待查詢式和文檔的關(guān)系?如何計算查詢式和文檔之間的相似度?Evaluationonly.CreatedwithAspose.Sl

7、idesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.模型的分類從所使用的數(shù)學(xué)方法上分:基于集合論的IR模型(SetTheoreticmodels)布爾模型基于模糊集的模型擴(kuò)展布爾模型基于代數(shù)論的IR模型(Algebraicmodels)向量空間模型潛性語義索引模型基于概率統(tǒng)計的IR模型(Probabilisticmodels)回歸模型二元獨(dú)立概率模型語言模型建模IR模型Evaluationonly.CreatedwithAspose.Slidesfor.N

8、ET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.1布爾模型(BooleanModel)布爾模型是建立經(jīng)典集合論和布爾邏輯代數(shù)的基礎(chǔ)上。優(yōu)勢:“集合”概念直

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。