信息檢索與利用-檢索流程

信息檢索與利用-檢索流程

ID:41530053

大?。?19.51 KB

頁數(shù):28頁

時(shí)間:2019-08-27

信息檢索與利用-檢索流程_第1頁
信息檢索與利用-檢索流程_第2頁
信息檢索與利用-檢索流程_第3頁
信息檢索與利用-檢索流程_第4頁
信息檢索與利用-檢索流程_第5頁
資源描述:

《信息檢索與利用-檢索流程》由會員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。

1、信息檢索流程(以期刊為例)課題選擇檢索詞(限定詞、同義詞)初步擬定檢索式并導(dǎo)入數(shù)據(jù)庫調(diào)整檢索策略再次擬定檢索式(考慮查全、查準(zhǔn)率)并導(dǎo)入數(shù)據(jù)庫命中結(jié)果(題錄形式)閱讀單篇摘要    批量下載摘要索取全文(中文、外文)1.切分切分是對課題的語句以詞為單位進(jìn)行拆分,轉(zhuǎn)換為檢索的最小單元。例1:檢索“婦女吸煙與肺癌的關(guān)系研究”相關(guān)文獻(xiàn)。直接切分:婦女

2、吸煙

3、與

4、肺癌

5、的

6、關(guān)系

7、研究注意:當(dāng)詞切分后將失去原來的意思時(shí),不應(yīng)再切分,即必須注意保持意義的完整。如“中國科學(xué)院”、“電子郵件”不可再切分。檢索詞選擇技巧-12.刪除刪除是對自然語言中不具有實(shí)質(zhì)性檢索意義的:虛詞(如介詞、連詞、副詞等

8、),使用頻率較低的詞,專指性太高、過分寬泛的詞過分具體的限定詞不能表達(dá)課題實(shí)質(zhì)的高頻詞存在蘊(yùn)含關(guān)系可以合并的詞檢索詞選擇技巧-1英語或漢語中都有許多虛詞,不能作為檢索詞。如:漢語中“的、地、得、了”等助詞英語中的aaboutalsoandanyasatbebetweenbybothforsomesonotthiswith等介詞或冠詞等檢索詞選擇技巧-1例2:檢索“中國非常規(guī)天然氣工業(yè)的發(fā)展前景研究”方面的相關(guān)文獻(xiàn)。進(jìn)行拆分以后,工業(yè)、發(fā)展、前景、研究這四個(gè)自由詞具有一定的檢索意義,但是由于或者是意義過于寬泛、或者是不能表達(dá)課題實(shí)質(zhì)、或者是存在蘊(yùn)含關(guān)系的原因,沒有必要全部作為檢索詞,

9、根據(jù)需要可以保留1-2個(gè)作為檢索詞。檢索詞選擇技巧-1檢索詞選擇技巧-1檢索詞選擇技巧-1檢索詞選擇技巧-2選定的檢索詞應(yīng)符合檢索目的;確認(rèn)檢索詞是否為規(guī)范詞;并列出常用中外文同義詞、縮寫詞,以及核心詞的上下位類詞。充分利用詞表、詞典、百度、谷歌、讀秀,并從已檢出的文獻(xiàn)中,擴(kuò)展檢索用詞。(1)立足規(guī)范詞,兼顧自由詞(2)注意詞的全稱、簡稱及縮寫字母(3)必要時(shí)應(yīng)向上下位類詞擴(kuò)檢(4)注意外來詞的譯寫變化(5)同義詞的選擇方法(1)立足規(guī)范詞,兼顧自由詞膠粘劑2611黏合劑125粘合劑1021粘固劑74粘結(jié)劑668粘附劑44膠黏劑275膠合劑21粘接劑225粘膠劑19中國期刊全文數(shù)據(jù)

10、庫/篇名字段/2000-2010年(2)注意詞的全稱、簡稱及縮寫字母乙型病毒性肝炎1318乙型肝炎1842629977乙肝10233脫氧核糖核酸19721291DNA21094中國期刊全文數(shù)據(jù)庫/篇名字段/1999-2009年/09.03.05(3)必要時(shí)應(yīng)向上下位類詞擴(kuò)檢電阻焊112F點(diǎn)焊621(點(diǎn)焊-電阻焊)620縫焊222(縫焊-電阻焊)222凸焊37(凸焊-電阻焊)37實(shí)際報(bào)道“電阻焊”的文獻(xiàn)量:112+620+222+37=991(篇)中國期刊全文數(shù)據(jù)庫/篇名字段/1999-2009年/09.03.09例1:“婦女吸煙與肺癌的關(guān)系研究”切分:婦女/吸煙/與/肺癌/的/關(guān)系

11、/研究核心檢索詞:吸煙、肺癌,補(bǔ)充上位詞:煙、癌癥、惡性腫瘤。檢索式:(吸煙or煙)and(肺癌or癌癥or惡性腫瘤)例2:“人工智能技術(shù)在計(jì)算機(jī)輔助教學(xué)中的應(yīng)用與實(shí)現(xiàn)”切分:人工智能/技術(shù)/在/計(jì)算機(jī)/輔助設(shè)計(jì)/中/的/應(yīng)用/與/實(shí)現(xiàn)核心詞:人工智能、計(jì)算機(jī)輔助設(shè)計(jì)擴(kuò)展:人工智能:同義詞:智能模擬下位概念:模式識別、自然語言理解與生成、專家系統(tǒng)、自動程序設(shè)計(jì)、數(shù)據(jù)智能檢索計(jì)算機(jī)輔助教學(xué)系統(tǒng)(computerAidedInstruction,CAD)檢索式:(人工智能OR智能模擬OR模式識別OR自然語言理解與生成OR專家系統(tǒng)OR自動程序設(shè)計(jì))AND(計(jì)算機(jī)輔助教學(xué)ORCAD)(4)

12、注意外來詞的譯寫變化波爾茲曼20歐幾里德30玻耳茲曼31歐幾里得59玻爾茲曼34歐基里德5波耳茲曼3歐幾理德1波爾茨曼0歐氏幾何17Boltzmann374Euclid75(注意:用英文名檢出的中文文獻(xiàn)最多!)中國期刊全文數(shù)據(jù)庫/篇名字段/1999-2009年/09.03.09同義詞的選擇方法除前面介紹的幾種方法選擇同義詞之外,再介紹幾種常用的方法。(1)利用數(shù)據(jù)庫的同義詞選擇功能(2)利用搜索引擎尋找同義詞(3)從數(shù)據(jù)庫檢索結(jié)果中尋找同義詞(4)利用自己的專業(yè)知識(5)利用自己平時(shí)積累的知識維普期刊庫百度艾滋病AIDSHIVSTD愛滋病……中國期刊庫6所謂的檢索提問式(query

13、,searchformulation),是信息檢索中用來表達(dá)用戶檢索提問的邏輯表達(dá)式。組成:布爾邏輯算符、位置算符、截詞符、限制算符系統(tǒng)規(guī)定的其他組配連接符號構(gòu)造檢索式構(gòu)造檢索式(試驗(yàn)性檢索)簡單提問式——含一個(gè)檢索詞的提問式;上下文提問式——精確短語或近似精確短語的提問式,也可稱為短語提問式;復(fù)合提問式——含有布爾算符和至少2個(gè)檢索詞的提問式;結(jié)構(gòu)性提問式——含有2個(gè)以上布爾算符和至少4個(gè)檢索詞的多層結(jié)構(gòu)組合的提問式。例4:地震序列分析的工具和方法研究要完成本項(xiàng)檢索

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當(dāng)前文檔最多預(yù)覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學(xué)公式或PPT動畫的文件,查看預(yù)覽時(shí)可能會顯示錯(cuò)亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權(quán)歸屬用戶,天天文庫負(fù)責(zé)整理代發(fā)布。如果您對本文檔版權(quán)有爭議請及時(shí)聯(lián)系客服。
3. 下載前請仔細(xì)閱讀文檔內(nèi)容,確認(rèn)文檔內(nèi)容符合您的需求后進(jìn)行下載,若出現(xiàn)內(nèi)容與標(biāo)題不符可向本站投訴處理。
4. 下載文檔時(shí)可能由于網(wǎng)絡(luò)波動等原因無法下載或下載錯(cuò)誤,付費(fèi)完成后未能成功下載的用戶請聯(lián)系客服處理。