資源描述:
《分析用戶檢索行為改善檔案信息檢索系統(tǒng)》由會(huì)員上傳分享,免費(fèi)在線閱讀,更多相關(guān)內(nèi)容在教育資源-天天文庫。
1、分析用戶檢索行為改善檔案信息檢索系統(tǒng)社會(huì)歷史學(xué)院2012級檔案學(xué)104032012020林小娟104032012021林凱微摘要:用戶的差異性表現(xiàn)為網(wǎng)絡(luò)檢索行為和方式的不同,本文在用戶網(wǎng)絡(luò)檢索行為分析的基礎(chǔ)上,對現(xiàn)今檔案信息檢索系統(tǒng)設(shè)計(jì)時(shí)的界面、提示等各方面進(jìn)行了分析,并提出相關(guān)改進(jìn)舉措。關(guān)鍵詞:用戶行為檢索系統(tǒng)現(xiàn)存問題改進(jìn)舉措隨著檢索技術(shù)的發(fā)展,用戶的差異性逐漸在網(wǎng)絡(luò)檢索行為中得到重視,網(wǎng)絡(luò)檢索系統(tǒng)逐漸從資源整合擴(kuò)展到差異化的用戶需求整合。在信息檢索研究中,也開始從用戶交互角度考慮網(wǎng)絡(luò)信息資源檢索機(jī)
2、制和機(jī)器學(xué)習(xí)功能,開發(fā)針對特定用戶組的檢索系統(tǒng)和個(gè)性化的信息導(dǎo)航。一、用戶檢索行為分析1.用戶使用的網(wǎng)絡(luò)檢索語言口語化比如檢索一個(gè)課題“螢火蟲發(fā)光的原理”,一般用戶會(huì)說“為什么螢火蟲會(huì)發(fā)光”。2.習(xí)慣只瀏覽前幾頁檢索結(jié)果在問卷“在查看檢索結(jié)果的時(shí)候你會(huì)?”中,選項(xiàng)“只看前幾頁”被選率最高,達(dá)58.6%;其次是“隨便抽幾頁看”(23.1%);最低的是“一頁一頁看到最后”,占16.5%;也有用戶選擇“其他項(xiàng)”,填寫的內(nèi)容有:只看前幾條記錄等。這題的結(jié)果與目前學(xué)術(shù)界的結(jié)論一致,即用戶在查看檢索結(jié)果時(shí)傾向于只
3、看前幾頁內(nèi)的記錄。3.對檢索后返回的結(jié)果不滿意,會(huì)通過查看相關(guān)的返回結(jié)果記錄的方式重選檢索詞進(jìn)行檢索,很少改變檢索工具在問卷“當(dāng)搜索引擎返回的結(jié)果不能滿足您的要求時(shí),通常你會(huì):”為題,調(diào)查受訪者對檢索的調(diào)整行為。選項(xiàng)“瀏覽部分檢索結(jié)果并獲得相關(guān)信息,然后重新選擇檢索詞檢索”的比例最大,占37.2%;其次是選項(xiàng)“直接更換檢索詞重新檢索”占27.8%和“利用上一次檢索用詞的同義詞或相關(guān)詞進(jìn)行再次檢索”占26.1%;最低的是選項(xiàng)“轉(zhuǎn)到其他的搜索引擎重新檢索”,占8.9%。這說明很大一部分用戶會(huì)把檢索過程看作
4、一個(gè)學(xué)習(xí)的過程,在檢索結(jié)果不能滿足要求時(shí)將優(yōu)先選擇改變檢索用詞,不會(huì)輕易改用其他的搜索引擎檢索。4.一般使用公認(rèn)的檢索性能較高較著名的檢索工具,對于檢索工具的高級檢索途徑使用很少在問卷“你經(jīng)常使用下面的哪些搜索引擎?”,受訪用戶使用最普遍的是百度,使用比例達(dá)91.7%;Google其次,使用比例為52.2%;中搜和openfind的使用程度較低,均在2%以下。在其他項(xiàng)中,有人填了hao123.com等等,大多數(shù)為檢索娛樂性信息的搜索網(wǎng)站,但比例也很低。這說明用戶在選擇搜索引擎時(shí)的個(gè)性化并不高,還是選用
5、公認(rèn)的檢索性能較高、較著名的搜索引擎。5.檢索前準(zhǔn)備不足,盲目檢索在問卷“在利用搜索引擎查找信息之前,通常您會(huì)做哪些準(zhǔn)備工作?”。選項(xiàng)“找出與檢索課題相關(guān)的檢索詞(如近義詞等)備用”被選率最高,占38.2%;其次是選項(xiàng)“沒有任何準(zhǔn)備工作”,占35.1%;最低是“了解一些背景知識,然后選擇檢索詞檢索”,占26.8%。這說明大多數(shù)用戶在檢索前的有一定的準(zhǔn)備工作,但還有相當(dāng)一部分人是在毫無準(zhǔn)備或粗略準(zhǔn)備的情況下進(jìn)行檢索。二、檔案信息檢索系統(tǒng)現(xiàn)存問題1.檔案檢索系統(tǒng)的建設(shè)流于表面化、形式化大多數(shù)網(wǎng)站都只是將文
6、件或案卷目錄直接數(shù)字化,沒有針對性地研究自身館藏和用戶利用特點(diǎn),建設(shè)數(shù)據(jù)庫。有些專題目錄檢索只是掛名,無實(shí)質(zhì)性內(nèi)容;有些甚至顯示1950年代短期保存的文件。2.檔案檢索界面設(shè)計(jì)粗糙、不友好有些檢索界面用戶很難快速適應(yīng),不符合常規(guī)使用習(xí)慣。過于粗糙,無相關(guān)操作提示,各個(gè)數(shù)據(jù)庫之間的切換有時(shí)會(huì)造成死鏈,檢索結(jié)果的顯示方式無序,用戶很難從中找到自己需要的特定信息。而出錯(cuò)頻率直接影響到檢索系統(tǒng)的可用性和用戶的熱情及忠誠度。3.檔案著錄標(biāo)引工作不全面大多數(shù)網(wǎng)站以關(guān)鍵詞為檢索入口,但關(guān)鍵詞標(biāo)引只是從文件題名中提取
7、,而未對檔案原件內(nèi)容進(jìn)行主題分析。如輸入“林業(yè)”一詞,只顯示題名中有“林業(yè)”的條目,不顯示原文涉及“林業(yè)”的條目。由于沒有提供責(zé)任者、時(shí)間等外部特征檢索途徑,使得責(zé)任者中含“林業(yè)”的條目也被漏檢,影響檢全率。4.檢索系統(tǒng)缺少語義控制語義是影響檢索系統(tǒng)最重要的因素。由于檢索系統(tǒng)多數(shù)以關(guān)鍵詞為檢索語言,未經(jīng)規(guī)范化處理,不能充分體現(xiàn)語義控制。如一詞多體、俗稱與學(xué)名、舊稱與新稱、全稱與簡稱缺少控制,使同一主題的檔案分散,降低了檢準(zhǔn)率與檢全率。如輸入“公共汽車”.可得到相應(yīng)條目,但輸入簡稱“公車”,卻無顯示。5
8、.數(shù)據(jù)庫數(shù)據(jù)不一致,數(shù)據(jù)庫之間缺少關(guān)聯(lián)。同一數(shù)據(jù)庫要求所有全宗、案卷和文件記錄條目的數(shù)據(jù)遵循同一技術(shù)規(guī)則。但一些網(wǎng)站的檔案信息未統(tǒng)一著錄項(xiàng)目和格式,文件級與案卷級目錄之間未形成索引.如查詢到的文件目錄卻無對應(yīng)的字段可鏈接到其所在的案卷目錄,查詢到的案卷目錄也無法明確其包含哪些文件。三、改善檔案信息檢索系統(tǒng)的舉措1.豐富數(shù)字化館藏?cái)?shù)字資源是檔案檢索的基礎(chǔ)。目前全國有相當(dāng)一部分已達(dá)開放期限的檔案還未全部開放,應(yīng)盡快將這些檔案分類鑒定并數(shù)字化。不求全求大.而要