幾種常用的Internet個性化信息檢索技術的探討

幾種常用的Internet個性化信息檢索技術的探討

ID:46697191

大?。?0.00 KB

頁數(shù):7頁

時間:2019-11-26

幾種常用的Internet個性化信息檢索技術的探討_第1頁
幾種常用的Internet個性化信息檢索技術的探討_第2頁
幾種常用的Internet個性化信息檢索技術的探討_第3頁
幾種常用的Internet個性化信息檢索技術的探討_第4頁
幾種常用的Internet個性化信息檢索技術的探討_第5頁
資源描述:

《幾種常用的Internet個性化信息檢索技術的探討》由會員上傳分享,免費在線閱讀,更多相關內(nèi)容在工程資料-天天文庫。

1、幾種常用的Internet個性化信息檢索技術的探討網(wǎng)上信息極度膨脹導致查找信息猶如大海撈針,雖然Google等優(yōu)秀搜索引擎提供瞭大量的信息資源,但仍需根據(jù)檢索到的地址信息,按照頁面屏幕的提示向下追蹤。特別是對於那些對專業(yè)信息有迫切需求的專業(yè)人士來說,難以迅速、準確地獲得有價值的網(wǎng)上信息資源因此用戶迫切希望找到一種能夠在信息海洋中自動獲取實用、準確、精煉的信息的工具一、智能代理Agent檢索技術智能代理又稱智能體,它是在用戶沒有明確具體要求的情況下,根據(jù)用戶需要,代替用戶進行各種復雜的工作,如信息查詢、篩選及管理,並能推測用戶的意自主制定、調(diào)整和執(zhí)行工作計劃。它

2、使用自動獲得的領域模型(如web知識、信息處理、與用戶興趣相關的信息資源、領域組織結(jié)構(gòu))、用戶模型(如用戶背景、興趣、行為、風格)知識進行信息搜集、索引、過濾(包括興趣過濾和不良信息過濾),並自動地將用戶感興趣的、對用戶有用的信息提交給用戶。智能代理具有瞭不斷學習、適應信息和用戶興趣動態(tài)變化的能力,從而提供個性化的服務1、智能代理Agent意義從用戶的角度來看,采用智能代理技術的應用服務系統(tǒng)在不間斷地為他們工作,用戶隻在必要時才需要參與從應用的角度來看,智能代理就是能自動執(zhí)行用戶委托的任務的計算實體,它有著極其廣泛的應用從技術的角度來看,智能代理是以各種技術為

3、基礎,集合瞭許多實用的應用特性,從而能自動執(zhí)行用戶委托的任務2、智能代理有兩個主要技術特征:智能性(Intelligence)和代理能力(Agency).智能性指應用系統(tǒng)使用推理、學習和其他技術來分析解釋它已接觸過的或剛提交給它的各種信息和知識的能力。代理能力指一個代理感知其環(huán)境並相應動作的能力3.智能代理包括四方面的關鍵技術:機器技術(Machinery)、內(nèi)容技術(Content)、訪問技術(Access)>安全技術(Security)機器技術:機器是指各種在人工智能領域中開發(fā)的、支持各種程度智能的引擎。這些引擎包括有:各種形式的推理引擎、學習引擎、用戶創(chuàng)

4、建修改規(guī)則和知識的工具、驗證規(guī)則集的工具和用於開發(fā)代理之間、代理和用戶之間進行協(xié)商和協(xié)作所需策略的工具。機器技術中的核心是推理機和學習機,它們提供瞭智能代理所需的推理能力和學習能力內(nèi)容技術:指機器用於推理和學習的數(shù)據(jù),但它不一定就是知識,它主要包括屬於結(jié)構(gòu)化知識的規(guī)則、語法,大量非結(jié)構(gòu)化的通用知識和結(jié)構(gòu)化的數(shù)據(jù)。內(nèi)容作為代理系統(tǒng)能夠內(nèi)核訪問的系統(tǒng)數(shù)據(jù)也存在於核心中,它提供代理系統(tǒng)工作所需要的各種知識和數(shù)據(jù),同時機器也可以直接對其進行更新訪問技術:訪問是指代理與周圍環(huán)境進行交互。代理與周圍環(huán)境的交互可以分為代理應用之間的交互與代理和用戶的交互。代理應用之間的交互

5、又可分為對本地環(huán)境與遠程環(huán)境的訪問安全機制是為瞭實現(xiàn)於外界的安全訪問而設置。外界是代理的交互對象,應包括所需要的原始信息源、用戶、代理所屬的應用系統(tǒng)、其他代理系統(tǒng)等二、智能Agent主要功能用於信息服務的智能Agent主要完成以下功能:導航,即告訴用戶所需要的資源在哪裡;解惑,即根據(jù)網(wǎng)上資源回答用戶關於特定主題的問題;過濾,即按照用戶指定的條件,從流向用戶的大量信息中篩選符合條件的信息,並以不同級別(全文、詳細摘要、簡單摘要、標題)呈現(xiàn)給用戶;整理,即為用戶把已經(jīng)下載的資源進行分門別類的組織;發(fā)現(xiàn),即從大量的公共原始數(shù)據(jù)中篩選和提煉有價值的信息,向有關用戶發(fā)佈

6、。這些都是使信息服務走向個性化主動服務不可缺少的功能。目前在此方面己經(jīng)有瞭一些能夠使用的系統(tǒng),但智能化的程度還遠遠不夠,且主動有餘的過濾不足己經(jīng)造成瞭一些負面的影響,有待盡快發(fā)展更先進的人工智能技術予以解決三、網(wǎng)絡信息挖掘(WebMining)技術網(wǎng)絡信息挖掘源於數(shù)據(jù)挖掘。數(shù)據(jù)挖掘就是指從大量數(shù)據(jù)(如數(shù)據(jù)庫)中提取抽象的、潛在的有用信息的過程,它是數(shù)據(jù)庫中知識發(fā)現(xiàn)KDD的核心,為大量數(shù)據(jù)的利用提供瞭有效的工具。數(shù)據(jù)挖掘的成功使研究人員將數(shù)據(jù)挖掘技術用於因特網(wǎng),但是由於WWW上的數(shù)據(jù)不同於傳統(tǒng)數(shù)據(jù),故產(chǎn)生瞭一個新的研究方向一網(wǎng)絡信息挖掘網(wǎng)絡信息挖掘,又稱為基於W

7、eb的數(shù)據(jù)挖掘,是從大量數(shù)據(jù)中抽取處先前未知的、完整的、可信的、新穎的、有效的信息的高級處理過程。它是在已知數(shù)據(jù)樣本的基礎上,通過歸納學習、機器學習、統(tǒng)計分析等方法得到數(shù)據(jù)對象間的內(nèi)在特性,據(jù)此采用信息過濾技術在網(wǎng)絡中提取用戶感興趣的信息或者更高層次的知識和規(guī)律來做關鍵的決策。網(wǎng)絡信息挖掘其實就是對文檔的內(nèi)容、要利用資源的使用以及資源之間的關系進行分析網(wǎng)絡信息挖掘分為Web日志挖掘、Web內(nèi)容挖掘、Web結(jié)構(gòu)挖掘。具體而言,Web日志挖掘是通過分析Web服務器的日志文件,對用戶訪問Web是服務器方留下的訪問記錄進行挖掘,從中可以得出用戶的訪問模式和訪問興趣,丈

8、站點管理員提供各種利於Web站點改進或

當前文檔最多預覽五頁,下載文檔查看全文

此文檔下載收益歸作者所有

當前文檔最多預覽五頁,下載文檔查看全文
溫馨提示:
1. 部分包含數(shù)學公式或PPT動畫的文件,查看預覽時可能會顯示錯亂或異常,文件下載后無此問題,請放心下載。
2. 本文檔由用戶上傳,版權歸屬用戶,天天文庫負責整理代發(fā)布。如果您對本文檔版權有爭議請及時聯(lián)系客服。
3. 下載前請仔細閱讀文檔內(nèi)容,確認文檔內(nèi)容符合您的需求后進行下載,若出現(xiàn)內(nèi)容與標題不符可向本站投訴處理。
4. 下載文檔時可能由于網(wǎng)絡波動等原因無法下載或下載錯誤,付費完成后未能成功下載的用戶請聯(lián)系客服處理。