淺談互聯(lián)網(wǎng)幾種信息檢索模型比較

淺談互聯(lián)網(wǎng)幾種信息檢索模型比較

ID:20702405

大?。?5.50 KB

頁(yè)數(shù):6頁(yè)

時(shí)間:2018-10-15

淺談互聯(lián)網(wǎng)幾種信息檢索模型比較_第1頁(yè)
淺談互聯(lián)網(wǎng)幾種信息檢索模型比較_第2頁(yè)
淺談互聯(lián)網(wǎng)幾種信息檢索模型比較_第3頁(yè)
淺談互聯(lián)網(wǎng)幾種信息檢索模型比較_第4頁(yè)
淺談互聯(lián)網(wǎng)幾種信息檢索模型比較_第5頁(yè)
資源描述:

《淺談互聯(lián)網(wǎng)幾種信息檢索模型比較》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在學(xué)術(shù)論文-天天文庫(kù)。

1、淺談互聯(lián)網(wǎng)幾種信息檢索模型比較:對(duì)信息檢索模型研究的主要內(nèi)容和構(gòu)建策略進(jìn)行了描述,給出了幾種常用的信息檢索模型相關(guān)性算法,分析了它們的優(yōu)缺點(diǎn),并就存在的問(wèn)題進(jìn)行了探討,總結(jié)了信息檢索模型的研究現(xiàn)狀和發(fā)展趨勢(shì)。    parisiononInformationRetrievaModels ?。↗iangsuProvincialmunicationsPlanningandDesignInstituteCo.,LTD,Nanjing?210005,China)  Abstract:Thisarticledescribedthemaincontentsandthe

2、constructionstrategyofthemodelsofinformationretrieval,demonstratedalotofmethodsinmonusages,odelofinformationretrieval.Andinthisarticle,theadvantagesanddisadvantagessthatisstillexistinghavebeenresearched.Inaddition,thecurrentsituationofthisresearchandthedevelopmenttendencyofthemode

3、lofinformationretrievalmarizadinthisarticle.  Keyationretrievalmodels;Relativity;Inquiry;Searchengine  當(dāng)前,隨著互聯(lián)X的普及和X上信息的爆炸式增長(zhǎng),信息檢索系統(tǒng)及其核心技術(shù)搜索引擎的性能和效率問(wèn)題已成為人們研究和關(guān)注的焦點(diǎn)。影響一個(gè)搜索引擎系統(tǒng)的性能有很多因素,但最主要的是信息檢索模型,其研究?jī)?nèi)容包括文檔和查詢(xún)的表示方法、評(píng)價(jià)文檔和用戶(hù)查詢(xún)相關(guān)性的匹配策略、查詢(xún)結(jié)果的排序方法和用戶(hù)進(jìn)行相關(guān)度反饋的機(jī)制。本文從研究文檔與用戶(hù)查詢(xún)“相關(guān)性”匹配的角度出發(fā),對(duì)

4、信息檢索模型研究的主要內(nèi)容和構(gòu)建策略進(jìn)行了詳細(xì)的描述,并給出了幾種常用的信息檢索模型相關(guān)性算法,分析了它們的優(yōu)缺點(diǎn)及存在的問(wèn)題,總結(jié)了當(dāng)前信息檢索模型的研究現(xiàn)狀和發(fā)展趨勢(shì),其目的在于提高信息檢索、查詢(xún)的性能和效率?! ∫弧?gòu)建信息檢索模型的策略  當(dāng)前,構(gòu)建信息檢索模型的主要策略有以下兩個(gè): ?。ㄒ唬┩ㄓ玫男畔z索模型  構(gòu)建一個(gè)通用的信息檢索模型,研究?jī)?yōu)化的匹配算法,提高查詢(xún)速度、查全率和查準(zhǔn)率,最大程度地滿(mǎn)足一般用戶(hù)的查詢(xún)需求?! 。ǘ┯脩?hù)興趣模型  根據(jù)特定用戶(hù)查詢(xún)興趣要求構(gòu)建用戶(hù)興趣模型或共同興趣模型,能夠盡可能地滿(mǎn)足特殊用戶(hù)查詢(xún)的需求。它可以構(gòu)

5、建一個(gè)適合行業(yè)或?qū)I(yè)應(yīng)用語(yǔ)義要求信息獲取模型。如google就能推斷用戶(hù)的使用意圖,提供動(dòng)態(tài)的、即時(shí)的用戶(hù)“個(gè)性化定制”信息,幫助用戶(hù)快速、準(zhǔn)確地定位到所需要的信息?! 《?、常用的信息檢索相關(guān)性算法  (一)布爾模型  布爾模型是基于特征項(xiàng)的嚴(yán)格匹配模型,文本查詢(xún)的匹配規(guī)則遵循布爾運(yùn)算的法則。用戶(hù)可以根據(jù)檢索項(xiàng)在文檔中的布爾邏輯關(guān)系提交查詢(xún),搜索引擎則根據(jù)事先建立的倒排文件結(jié)構(gòu),確定查詢(xún)結(jié)果。標(biāo)準(zhǔn)的布爾邏輯模型為二元邏輯,所搜索的文檔要么與查詢(xún)相關(guān),要么與查詢(xún)無(wú)關(guān)。查詢(xún)結(jié)果一般不進(jìn)行相關(guān)性排序?! ≡诓紶柲P椭校粋€(gè)文檔通過(guò)一個(gè)關(guān)鍵詞條的集合來(lái)表示,這些詞

6、條都來(lái)自一個(gè)詞典。在查詢(xún)與文檔匹配的過(guò)程中,主要看該文檔中的詞條是否滿(mǎn)足查詢(xún)條件。布爾模型用文檔的檢索狀態(tài)值作為一種評(píng)價(jià)查詢(xún)和文檔相似性的一種方法。這里,首先定義關(guān)鍵詞集合S,關(guān)鍵詞為t1,t2,…,tn。  這些關(guān)鍵詞可以和邏輯操作符AND,OR和NOT形成不同的條件查詢(xún)。如果得到條件表達(dá)式的值為T(mén)rue,該文檔相對(duì)于此條查詢(xún)的檢索狀態(tài)值為1;如果若干文檔相對(duì)于此條查詢(xún)的檢索狀態(tài)值都為1,則可以認(rèn)為,這些文檔與此用戶(hù)的查詢(xún)是相關(guān)的?! 〔紶柲P偷闹饕獌?yōu)點(diǎn)有兩點(diǎn):一是實(shí)現(xiàn)起來(lái)比較容易,速度快,計(jì)算的代價(jià)相對(duì)較少。二是查詢(xún)語(yǔ)言表達(dá)簡(jiǎn)單,用戶(hù)可以使用任意復(fù)雜的

7、查詢(xún)表達(dá)式,易于表示同義關(guān)系(如:聾教育OR特殊教育)和詞組(如:計(jì)算機(jī)AND基礎(chǔ)AND課程改革)。它的缺點(diǎn)是,由于所有檢索到的與用戶(hù)查詢(xún)條件相關(guān)的文檔具有相同的檢索狀態(tài)值,則不能對(duì)查詢(xún)結(jié)果按照相關(guān)性進(jìn)行排序;另外關(guān)鍵詞也沒(méi)有考慮權(quán)重的影響,缺乏定量分析和靈活性以及不能表述模糊匹配。而為了克服布爾型信息獲取模型查詢(xún)結(jié)果的無(wú)序性,在查詢(xún)結(jié)果處理中引進(jìn)了模糊邏輯運(yùn)算,將所檢索的數(shù)據(jù)庫(kù)文檔信息與用戶(hù)的查詢(xún)要求進(jìn)行模糊邏輯比較,按照相關(guān)的優(yōu)先次序排列查詢(xún)結(jié)果?! 。ǘ┫蛄靠臻g模型  向量空間模型把信息庫(kù)中的文本以及用戶(hù)的查詢(xún)都表示成向量空間中的點(diǎn)(向量),用它們

8、之間夾角的余弦作為相似性度量。向量空間模型是現(xiàn)在的文本檢索系統(tǒng)以及

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁(yè),下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動(dòng)畫(huà)的文件,查看預(yù)覽時(shí)可能會(huì)顯示錯(cuò)亂或異常,文件下載后無(wú)此問(wèn)題,請(qǐng)放心下載。
2. 本文檔由用戶(hù)上傳,版權(quán)歸屬用戶(hù),天天文庫(kù)負(fù)責(zé)整理代發(fā)布。如果您對(duì)本文檔版權(quán)有爭(zhēng)議請(qǐng)及時(shí)聯(lián)系客服。
3. 下載前請(qǐng)仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動(dòng)等原因無(wú)法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶(hù)請(qǐng)聯(lián)系客服處理。