資源描述:
《《信息檢索模型》PPT課件》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、第二章信息檢索模型Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.內(nèi)容提要信息檢索系統(tǒng)的形式化表示布爾邏輯模型向量空間模型概率模型其他檢索模型Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.什么是模型?模型是采用數(shù)學(xué)工具,對現(xiàn)實世界
2、某種事物或某種運(yùn)動的抽象描述面對相同的輸入,模型的輸出應(yīng)能夠無限地逼近現(xiàn)實世界的輸出舉例:天氣的預(yù)測模型信息檢索模型給出了文檔的表示方法,查詢的表示方式以及查詢與文檔的匹配過程Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.信息檢索模型信息檢索模型是指如何對查詢和文檔進(jìn)行表示,然后對它們進(jìn)行相似度計算的框架和方法。本質(zhì)上是對相關(guān)度建模。信息檢索模型是IR中的核心內(nèi)容之一。Evalua
3、tiononly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.信息檢索模型一個信息檢索模型是由文檔表示、查詢、關(guān)系、模型框架構(gòu)成的四元組。四元組:System=(D,Q,F,R(dj,qi))D文檔集的表示Q用戶需求的表示F文檔表示、查詢表示和他們之間關(guān)系的模型框架(Frame)R(dj,qi)給出Queryqi和Documentdj的評分Evaluationonly.CreatedwithAspose.Sl
4、idesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.文檔邏輯視圖D是一個文檔集合,通常由文檔邏輯視圖來表示。可以是一組索引詞或關(guān)鍵詞。既可以自動提取,也可以是由人主觀指定。Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.匹配處理框架(F)在信息集合(D)與需求集合(F)之間建立模型化處理的框架與規(guī)則。不同
5、檢索模型的匹配處理的數(shù)學(xué)機(jī)制是不同的。布爾模型:集合論的基本運(yùn)算向量空間模型:多維向量空間理論和向量線性代數(shù)概率模型:集合論、概率運(yùn)算和Bayes法則Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.匹配計算函數(shù)R匹配函數(shù)R(dj,q)用于計算任一信息dj(dj∈D)與任一提問q(q∈Q)形成的信息——提問對(dj,q)之間的相似度大小。一般地,R(dj,q)的函數(shù)值為一實數(shù),其取值區(qū)
6、間為[0,1]匹配函數(shù)的特點(diǎn):計算方法簡單,計算量??;函數(shù)值在取值區(qū)間均勻分布;針對某一提問所獲取的相關(guān)文檔集合,能夠?qū)崿F(xiàn)合理的排序輸出。Evaluationonly.CreatedwithAspose.Slidesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.信息檢索模型決定于:從什么樣的視角去看待查詢式和文檔?基于什么樣的理論去看待查詢式和文檔的關(guān)系?如何計算查詢式和文檔之間的相似度?Evaluationonly.CreatedwithAspose.Sl
7、idesfor.NET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.模型的分類從所使用的數(shù)學(xué)方法上分:基于集合論的IR模型(SetTheoreticmodels)布爾模型基于模糊集的模型擴(kuò)展布爾模型基于代數(shù)論的IR模型(Algebraicmodels)向量空間模型潛性語義索引模型基于概率統(tǒng)計的IR模型(Probabilisticmodels)回歸模型二元獨(dú)立概率模型語言模型建模IR模型Evaluationonly.CreatedwithAspose.Slidesfor.N
8、ET3.5ClientProfile5.2.0.0.Copyright2004-2011AsposePtyLtd.1布爾模型(BooleanModel)布爾模型是建立經(jīng)典集合論和布爾邏輯代數(shù)的基礎(chǔ)上。優(yōu)勢:“集合”概念直